Willkommen bei der Rubrik „AI-Tagesbericht“! Hier finden Sie täglich Ihren Wegweiser durch die Welt der Künstlichen Intelligenz. Wir präsentieren Ihnen täglich die wichtigsten Themen aus dem Bereich KI, mit Fokus auf Entwickler, damit Sie technologische Trends erkennen und innovative KI-Produktanwendungen verstehen können.

Neue KI-Produkte hier entdecken: https://top.aibase.com/

1. Zhishu veröffentlicht CogView4, das erste Open-Source-Text-zu-Bild-Modell, das chinesische Schriftzeichen generieren kann

Am 4. März 2025 stellte die Beijing Zhishu Huazhang Technology Co., Ltd. CogView4 vor, das erste Open-Source-Text-zu-Bild-Modell, das die Generierung chinesischer Schriftzeichen unterstützt. Es verfügt über leistungsstarke zweisprachige Eingabe- und Bildgenerierungsfunktionen. Das Modell belegt in DPG-Bench-Benchmark-Tests den ersten Platz und ist damit das SOTA unter den Open-Source-Text-zu-Bild-Modellen. Es unterstützt beliebige Auflösungen und komplexe semantische Ausrichtung und erfüllt die Anforderungen von Bereichen wie Werbung und Kurzvideos.

image.png

【AiBase Zusammenfassung:】

🎨 CogView4 ist das erste Open-Source-Text-zu-Bild-Modell, das die Generierung chinesischer Schriftzeichen unterstützt und über leistungsstarke zweisprachige Eingabefunktionen verfügt.

🚀 Das Modell belegt in DPG-Bench-Benchmark-Tests den ersten Platz und ist damit das SOTA unter den Open-Source-Text-zu-Bild-Modellen.

🔧 CogView4 unterstützt das Apache2.0-Protokoll. Später werden Ökosystemunterstützung und ein Feineinstellungs-Toolkit hinzugefügt.

Detaillierter Link: https://github.com/THUDM/CogView4

2. Sensationell! MiniMax präsentiert das neue Bildgenerierungsmodell Image-01 mit nur 1/10 der Kosten

MiniMax hat kürzlich sein erstes Text-zu-Bild-Generierungsmodell Image-01 vorgestellt, das einen neuen Fortschritt in der KI-Bildgenerierungstechnologie darstellt. Das Modell zeichnet sich durch seine hervorragende Steuerung der Eingabeaufforderungen und seine visuellen Gestaltungsfähigkeiten aus. Benutzer können logisch konsistente und kunstvolle Bilder erstellen. Darüber hinaus ermöglichen die effiziente Batch-Verarbeitungsfunktion und der wettbewerbsfähige Preis von Image-01 einen einfacheren Zugang zu professioneller KI-Kreation. Benutzer können Bilder in Filmqualität zu geringeren Kosten erleben und so ihre kreativen Möglichkeiten erheblich erweitern.

image.png

【AiBase Zusammenfassung:】

🌟 Image-01 ist ein neues Text-zu-Bild-Generierungsmodell, das die kreativen Möglichkeiten der Benutzer erweitern soll.

🎨 Das Modell verfügt über eine präzise Steuerung der Eingabeaufforderungen und hervorragende visuelle Gestaltungsfähigkeiten und kann logisch konsistente und kunstvolle Bilder erzeugen.

💰 Die Kosten für Image-01 betragen nur ein Zehntel der Kosten vergleichbarer Produkte, wodurch professionelles KI-Schaffen leichter zugänglich wird.

Detaillierter Link: https://www.minimax.io/platform/login

3. Tencent Yuanbao übertrifft DeepSeek und erreicht Platz 1 der kostenlosen Apple App-Download-Charts

Tencent Yuanbao hat im Apple App Store in China einen bemerkenswerten Erfolg erzielt und DeepSeek als die am häufigsten heruntergeladene App überholt. Tencent hat durch verstärkte Werbung und technische Upgrades die Bekanntheit und Attraktivität von Yuanbao gesteigert, insbesondere durch die Integration in die WeChat-Plattform, wodurch sich die Benutzererfahrung deutlich verbessert hat.

image.png

【AiBase Zusammenfassung:】

📊 Tencent Yuanbao hat DeepSeek überholt und belegt den ersten Platz der kostenlosen Apple App-Download-Charts.

📱 Tencent verstärkt die Werbung für Yuanbao, insbesondere auf der WeChat-Plattform.

🚀 Technische Upgrades und Funktionsoptimierungen gewährleisten die schnelle Entwicklung von Yuanbao.

4. Mita AI Search startet Video-Suchfunktion

Am 3. März 2025 führte die Shanghai Mita Network Technology Co., Ltd. eine neue KI-Suchfunktion mit einem zusätzlichen Video-Suchmodul ein. Diese Funktion analysiert eine große Menge an Videoinhalten und hilft Benutzern, die benötigten Lern- und Unterhaltungsvideos effizienter zu finden. Benutzer können schnell die gewünschten Videos finden, was die Sucherfahrung verbessert.

image.png

【AiBase Zusammenfassung:】

🎥 Neues Video-Suchmodul, das multimodale Daten abdeckt und die Benutzererfahrung verbessert.

🔍 Benutzer können schnell die gewünschten Videoinhalte wie Kurse oder Werbeanalysen finden.

🚀 Anbindung an das DeepSeek R1 Inferenzmodell, um die Intelligenz der Suche weiter zu verbessern.

5. Revolutionär für Stadtmodellierung! AI-generiertes 3D-Stadtmodell GaussianCity, 60-fache Geschwindigkeitssteigerung!

Das Forschungsteam der Nanyang Technological University hat mit der GaussianCity-Technologie einen bemerkenswerten Durchbruch in der Generierung von 3D-Stadtmodellen erzielt. Die Technologie hat die Generierungsgeschwindigkeit um das 60-fache erhöht und unterstützt die grenzenlose Generierung von 3D-Städten. Sie wurde von CVPR2025 angenommen. GaussianCity verwendet die innovative BEV-Point-Darstellungsmethode und einen räumlich bewussten Gauß-Attribut-Decoder, wodurch die Berechnungseffizienz und Skalierbarkeit erheblich verbessert werden.

image.png

【AiBase Zusammenfassung:】

🚀 GaussianCity-Technologie erzielt eine 60-fache Geschwindigkeitssteigerung und bricht die Größenbeschränkungen herkömmlicher Methoden.

🌆 Verwendung der BEV-Point-Darstellungsmethode, wodurch der Bedarf an Arbeitsspeicher deutlich reduziert und eine grenzenlose 3D-Stadtgenerierung ermöglicht wird.

📈 Die Technologie ist Open Source und bietet neue Anwendungspotenziale für Bereiche wie Virtual Reality, autonomes Fahren und Stadtplanung.

Detaillierter Link: https://github.com/hzxie/GaussianCity

6. Sicherheitsrisiko! Ollama-Großsprachenmodell-Tool weist schwerwiegende Sicherheitslücke auf

Das nationale Zentrum für Cybersicherheit hat kürzlich eine Sicherheitswarnung zu dem Open-Source-Cross-Plattform-Großsprachenmodell-Tool Ollama herausgegeben und darauf hingewiesen, dass es in der Standardkonfiguration eine schwerwiegende Sicherheitslücke aufweist, die zu unautorisierten Zugriffen und Modelldiebstahl führen kann. Expertenanalysen zeigen, dass insbesondere Benutzer mit privater Bereitstellung einem größeren Risiko ausgesetzt sind. Angreifer können diese Sicherheitslücken für Datenlecks und Serviceunterbrechungen nutzen.

image.png

【AiBase Zusammenfassung:】

🔍 Die Sicherheitslücke von Ollama ist in der Standardkonfiguration schwerwiegend, insbesondere für Benutzer mit privater Bereitstellung.

💻 Angreifer können unautorisierte Zugriffe nutzen, um Modellinformationen zu stehlen und Serviceunterbrechungen zu verursachen, was zu erheblichen Verlusten führt.

🛡️ Benutzer sollten ihr Sicherheitsbewusstsein stärken, Sicherheitslücken rechtzeitig beheben und bei Anzeichen von Angriffen sofort die zuständigen Stellen benachrichtigen.

7. Extrem leistungsstarkes Videogenerierungsmodell Wan2.1 GP: Blockbuster auch mit Low-End-GPU möglich!

Das von DeepBeepMeep entwickelte Wan2.1GP ist ein für Low-End-GPU-Benutzer optimiertes Videogenerierungsmodell, das auf Alibabas Wan2.1 basiert und Benutzern ohne leistungsstarke GPU-Ressourcen leistungsstarke Videogenerierungsmöglichkeiten bieten soll. Das Modell zeigt in mehreren Benchmark-Tests eine hervorragende Leistung, unterstützt verschiedene Generierungsaufgaben und verfügt über chinesische und englische Textgenerierungsfunktionen. Dies stellt einen wichtigen Fortschritt in der Videogenerierungstechnologie dar.

image.png

【AiBase Zusammenfassung:】

👍 SOTA-Leistung: Wan2.1GP zeigt in mehreren Benchmark-Tests eine hervorragende Leistung und übertrifft bestehende Open-Source- und kommerzielle Lösungen.

🖥️ Hohe Kompatibilität: Es werden nur 8,19 GB Grafikspeicher benötigt, und es unterstützt fast alle Consumer-GPUs, daher ist es auch für Low-End-Benutzer geeignet.

📜 Unterstützung mehrerer Aufgaben: Unterstützt verschiedene Generierungsaufgaben wie Text-zu-Video und Bild-zu-Video und verfügt über chinesische und englische Textgenerierungsfunktionen.

Detaillierter Link: https://github.com/deepbeepmeep/Wan2GP

8. Vulkan Engine kündigt Open-Source-Großsprachenmodell-Anwendungen an: „Großsprachenmodell-Anwendungslabor“ geht online, um das Innovationspotenzial von KI freizusetzen

Vulkan Engine hat über die X-Plattform die offizielle Open-Source-Veröffentlichung von Großsprachenmodell-Anwendungen angekündigt und die neue Plattform „Großsprachenmodell-Anwendungslabor“ vorgestellt. Dieser Schritt markiert einen wichtigen Durchbruch im Aufbau des KI-Technologieökosystems und zielt darauf ab, die Innovationsgeschwindigkeit der Entwicklergemeinschaft zu beschleunigen. Die Open-Source-Anwendungen umfassen hochmoderne KI-Tools wie den mobilen Assistenten und Deep Research und werden von den Benutzern begeistert aufgenommen, was die führende Technologie von Vulkan Engine unterstreicht.

image.png

【AiBase Zusammenfassung:】

📱 Open-Source-Anwendungen umfassen mobile Assistenten, Deep Research usw. und bieten verschiedene KI-Tools, um die Innovation von Entwicklern zu fördern.

🌐 Das „Großsprachenmodell-Anwendungslabor“ geht online und bietet Entwicklern und Forschern eine offene Experimentierumgebung, um das Anwendungspotenzial von Großsprachenmodellen zu erkunden.

💬 Die Community-Reaktionen sind begeistert. Benutzer sind der Meinung, dass dieser Schritt die Einstiegshürde für die KI-Entwicklung senkt und die Zusammenarbeit und Innovation in der Branche fördert.

9. QQ Browser führt Funktion „KI-Aufsatzhilfe“ ein

Die vom QQ Browser eingeführte Funktion „KI-Aufsatzhilfe“ soll Schülern helfen, ihre Schreibfähigkeiten zu verbessern, anstatt nur Antworten zu liefern. Die Funktion bietet eine umfassende Anleitung zu Schreibtechniken und unterstützt Schüler bei jedem Schritt des Schreibprozesses, von der Ideenfindung über die Gliederung und Materialsammlung bis hin zur Generierung von Beispieltexten. Das KI-Tool betont seine unterstützende Rolle und fördert das Lesen und Nachdenken, um Schreibtechniken zu erlernen, anstatt einfach zu kopieren und einzufügen.

image.png

【AiBase Zusammenfassung:】

🧠 Die Funktion „KI-Aufsatzhilfe“ hilft Schülern, ihre Fähigkeiten im Schreibprozess zu verbessern, anstatt nur Antworten zu liefern.

📚 Die Funktion bietet eine umfassende Anleitung, die alle Schritte von der Ideenfindung über die Gliederung und Materialsammlung bis hin zur Generierung von Beispieltexten umfasst.

✍️ QQ Browser betont die Bedeutung von Lesen und Nachdenken und ermutigt Schüler, Schreibtechniken zu erlernen.

10. Anthropic sichert sich 35 Milliarden US-Dollar Finanzierung, Bewertung steigt auf 615 Milliarden US-Dollar

Anthropic hat kürzlich eine Finanzierungsrunde der Serie E in Höhe von 35 Milliarden US-Dollar abgeschlossen. Nach der Finanzierungsrunde beträgt die Bewertung 615 Milliarden US-Dollar, was die anhaltende Begeisterung der Investoren für den KI-Markt zeigt. Die Finanzierungsrunde wurde von Lightspeed Venture Partners angeführt und zog zahlreiche namhafte Investoren an. Die Mittel werden für die Weiterentwicklung von KI-Systemen der nächsten Generation verwendet. Trotz des intensiven Wettbewerbs konzentriert sich Anthropic weiterhin auf die B2B-Strategie und will globale Unternehmen mit technologischer Unterstützung versorgen.

image.png

【AiBase Zusammenfassung:】

💵 Anthropic hat eine Finanzierungsrunde der Serie E in Höhe von 35 Milliarden US-Dollar abgeschlossen, die Bewertung beträgt 615 Milliarden US-Dollar, was die anhaltende Begeisterung der Investoren für den KI-Markt zeigt.

📈 Der Jahresumsatz des Unternehmens erreichte 2024 1 Milliarde US-Dollar, ein zehnfaches Wachstum im Vergleich zum Vorjahr, und stieg Anfang 2025 erneut um 30 %.

🤝 Amazon und Google haben Anthropic jeweils 80 Milliarden US-Dollar bzw. 30 Milliarden US-Dollar zur Unterstützung seiner B2B-Strategie zur Verfügung gestellt.

11. Von der Programmierung bis zum kreativen Schreiben: xAI Grok-3 besiegt GPT4.5 und erreicht den Spitzenplatz im Großsprachenmodell-Wettbewerb

Das kürzlich von xAI vorgestellte Grok-3-Modell hat im Chatbot Arena-Ranking eine hervorragende Leistung gezeigt und mit geringem Vorsprung GPT4.5-Preview übertroffen. Das Modell mit dem Namen „grok-3preview-02-24“ zeigte in verschiedenen Bereichen, darunter Programmierung, Mathematik und kreatives Schreiben, eine herausragende Leistung. Obwohl es als neuestes Produktionsmodell bezeichnet wird, deutet der Begriff „Preview“ darauf hin, dass es sich noch in der Testphase befindet, was zu Diskussionen über seine Produktionsreife führen könnte.

image.png

【AiBase Zusammenfassung:】