Willkommen bei der Rubrik „AI-Tagesbericht“! Hier finden Sie täglich Ihre Orientierungshilfe zur Erkundung der Welt der Künstlichen Intelligenz. Täglich präsentieren wir Ihnen die wichtigsten Themen aus dem Bereich KI, mit Fokus auf Entwickler, um Ihnen zu helfen, Technologietrends zu erkennen und innovative KI-Produktanwendungen kennenzulernen.

Neue KI-Produkte hier entdecken: https://top.aibase.com/

1. Mehr Leistung zum gleichen Preis! Das Doubao-Großmodell 1.5 wird offiziell veröffentlicht, darunter Doubao-1.5-vision-pro usw.

ByteDance veröffentlichte am 22. Januar 2025 das Doubao-Großmodell 1.5, ein Zeichen für einen bedeutenden Durchbruch im Bereich der Künstlichen Intelligenz. Dieses Modell zeigt in verschiedenen Bereichen hervorragende Leistungen, insbesondere in den Bereichen Wissen, Code und Schlussfolgerungen, und übertrifft branchenführende Modelle wie GPT-4o und Claude3.5Sonnet. Das Doubao-Großmodell 1.5 beinhaltet außerdem ein Echtzeit-Sprachmodell, das die Effizienz und Benutzerfreundlichkeit der Sprachinteraktion verbessert.

image.png

【AiBase-Zusammenfassung:】

📈 Das Doubao-Großmodell 1.5 erzielte in mehreren autoritativen Tests hervorragende Ergebnisse und übertraf branchenführende Modelle.

💡 Das neu hinzugefügte Echtzeit-Sprachmodell ermöglicht Dialoge mit geringer Latenz und fördert den Fortschritt der Sprachinteraktionstechnologie.

💰 Der Preis bleibt unverändert, die Philosophie „Mehr Leistung zum gleichen Preis“ wird beibehalten, um die Verbreitung von KI-Technologie zu fördern.

Detaillierte Informationen: https://team.doubao.com/doubao_1_5_pro

2. Keling AI führt eine neue Funktion für mehrere Bildreferenzen ein, unterstützt mehrere Referenzen und erlaubt das Hochladen von bis zu 4 Fotos

Keling AI hat kürzlich eine innovative Funktion für mehrere Bildreferenzen eingeführt, die es Benutzern ermöglicht, bis zu vier Referenzbilder gleichzeitig hochzuladen und durch Auswahl bestimmter Elemente personalisierte Videos zu generieren. Diese Funktion verbessert nicht nur die visuelle Konsistenz bei der Erstellung von Kurzfilmen, sondern bietet den Erstellern auch mehr Freiheit, um die Interaktion von Charakteren oder Objekten in bestimmten Szenen darzustellen.

【AiBase-Zusammenfassung:】

📸 Benutzer können 1 bis 4 Referenzbilder hochladen und Personen, Objekte und Szenen angeben.

🎭 Die Funktion unterstützt die Interaktion zwischen Charakteren, Benutzer können frei Handlungsstränge erstellen.

🎨 Geeignet für die Erstellung von Kurzfilmen, um die visuelle Konsistenz zu gewährleisten und das Kreativ-Erlebnis zu verbessern.

Detaillierte Informationen: https://top.aibase.com/tool/keling-ai

3. WeChat erweitert die Funktionen seiner „Sekunden-Schnitt“-App um mehrere KI-Funktionen

Das von WeChat offiziell herausgegebene Schnittwerkzeug „Sekunden-Schnitt“ wurde kürzlich um mehrere praktische KI-Funktionen erweitert, die die Effizienz der Videoproduktion für Benutzer erheblich verbessern. Die neue Version beinhaltet die Funktionen „公众号文章 in Video umwandeln“, „KI-Comic-Video“ und „Werbevideo“. Benutzer können mit einfachen Schritten WeChat-公众号-Artikel in Videos umwandeln oder auf Text- und Audiobasis vielfältige Comic-Videos generieren.

image.png

【AiBase-Zusammenfassung:】

📝 Neue Funktion „公众号文章 in Video umwandeln“, um die Umwandlung von Artikeln in Videos zu erleichtern.

🎨 Die Funktion „KI-Comic-Video“ ermöglicht den Import von Text und Audio und unterstützt verschiedene Videostile.

🛍️ Die Funktion „Werbevideo“ generiert mit einem Klick Werbetexte und erhöht die Effizienz der Erstellung von E-Commerce-Videos erheblich.

4. Google aktualisiert Gemini 2.0 Flash Thinking, die Fähigkeit zur Verarbeitung langer Kontexte erreicht ein neues Hoch

Google veröffentlichte am 22. Januar 2025 eine verbesserte Version des Gemini 2.0 Flash Thinking Inferenzmodells, das die Fähigkeit zur Verarbeitung langer Kontexte deutlich verbessert und Eingaben von bis zu 1 Million Token unterstützt. Dieses Update zielt darauf ab, die Zuverlässigkeit des Modells zu erhöhen und Widersprüche zwischen den generierten Inhalten und der endgültigen Antwort zu reduzieren. Die neue Version zeigt nicht nur eine deutliche Verbesserung der Fähigkeiten in Mathematik, Naturwissenschaften und multimodalen Schlussfolgerungen, sondern auch eine Verbesserung der mathematischen Fähigkeiten um 54 %.

image.png

【AiBase-Zusammenfassung:】

🧠 Gemini 2.0 Flash Thinking unterstützt die Verarbeitung langer Kontexte mit bis zu 1 Million Token und verbessert die Inferenzfähigkeit komplexer Dialoge.

🔍 Das Modell zeigt eine deutliche Verbesserung in Bezug auf Selbstkorrektur, um die Kohärenz und Konsistenz von Dialogen zu gewährleisten.

📈 In Mathematiktests verbesserte sich das Modell um 54 % und zeigte hervorragende multimodale Inferenzfähigkeiten.

Detaillierte Informationen: https://aistudio.google.com/prompts/new_chat

5. SenseTime startet die „Sekunden-Malerei-Spaß-Foto“-App, unterstützt KI-Porträts, Videos und Filterfunktionen

SenseTime hat kürzlich die neue App „Sekunden-Malerei-Spaß-Foto“ veröffentlicht, die Benutzern ein innovatives KI-Bilderlebnis bietet. Diese Anwendung soll das neue Frühlingsfest feiern und Benutzern mit Hilfe von KI-Technologie dabei helfen, personalisierte Neujahrsporträts zu erstellen und eine festliche Atmosphäre zu schaffen. Benutzer müssen lediglich ein Frontalfoto hochladen, um Vorlagen auszuwählen und schnell KI-Porträts zu generieren. Darüber hinaus können Benutzer benutzerdefinierte Videos hochladen, um ihre Kreativität zu zeigen.

微信截图_20250122110826.png

【AiBase-Zusammenfassung:】

🎉 Benutzer können ein Frontalfoto hochladen, Vorlagen auswählen und mit einem Klick ein KI-Neujahrsporträt generieren.

🎨 Benutzerdefinierte Videos können hochgeladen werden, Benutzer können mit der Funktion „Vorlage-DIY“ personalisierte Werke erstellen.

🌟 Die App bietet Vorlagen in verschiedenen Stilen, um die individuellen Bedürfnisse verschiedener Benutzer zu erfüllen.

6. 500 Milliarden US-Dollar Investition! Trump kündigt die Gründung des Projekts „Sternentor“ durch OpenAI und andere Technologie-Giganten an

Trump kündigte im Weißen Haus die Gründung des Joint Ventures „Sternentor“ mit einem Investitionsvolumen von 500 Milliarden US-Dollar an, um ein Netzwerk von Rechenzentren und Recheninfrastrukturen aufzubauen, um die Entwicklung der Künstlichen Intelligenz voranzutreiben. Das Projekt wird voraussichtlich über 100.000 Arbeitsplätze schaffen und durch eine Notstandserklärung beschleunigt werden, was eine bedeutende Veränderung der US-amerikanischen KI-Politik darstellt.

【AiBase-Zusammenfassung:】

🌟 Trump kündigt die Gründung des 500 Milliarden US-Dollar schweren KI-Joint Ventures „Sternentor“ an, mit dem Ziel, ein Netzwerk von Rechenzentren aufzubauen.

💼 Das Projekt wird voraussichtlich über 100.000 Arbeitsplätze in den USA schaffen und den Infrastrukturaufbau schnell vorantreiben.

⚡ Trump wird das Projekt durch eine Notstandserklärung beschleunigen und gleichzeitig frühere Dekrete zur KI-Sicherheit aufheben.

7. NetEase Youdao veröffentlicht das Inferenzmodell „Ziyu-o1“ mit schrittweiser Erklärung als Open Source

NetEase Youdao veröffentlichte am 22. Januar 2025 das erste Inferenzmodell in China mit schrittweiser Erklärung, „Ziyu-o1“, und gab dessen Open-Source-Veröffentlichung bekannt. Dieses 14B-Leichtgewicht-Modell ist speziell für Consumer-Grafikkarten konzipiert und kann auf Geräten mit geringem Arbeitsspeicher stabil laufen. Durch die Denk-Ketten-Technologie bietet das Modell detaillierte Lösungswege und logische Schlussfolgerungen, um Benutzern ein besseres Verständnis von Wissen zu ermöglichen.

image.png

【AiBase-Zusammenfassung:】

🖥️ „Ziyu-o1“ ist das erste Inferenzmodell in China mit schrittweiser Erklärung, das speziell für Consumer-Grafikkarten entwickelt wurde und auf Geräten mit geringem Arbeitsspeicher stabil läuft.

📚 Das Modell bietet durch die Denk-Ketten-Technologie detaillierte Lösungswege, die Benutzern helfen, Wissen besser zu verstehen und zu beherrschen und die Lernergebnisse zu verbessern.

🔍 Die Open-Source-Natur ermöglicht es Entwicklern, das Modell für Innovationen zu nutzen und die Entwicklung von KI-Technologien im Bildungsbereich voranzutreiben.

Detaillierte Informationen: https://confucius-o1-demo.youdao.com/

8. Microsoft und OpenAI passen ihre Partnerschaft an, öffnen den Zugang zu Rechenressourcen von Wettbewerbern

Die Partnerschaft zwischen Microsoft und OpenAI wurde erheblich angepasst. OpenAI hat jetzt Zugriff auf die Rechenressourcen von Wettbewerbern und ist nicht mehr von Microsoft Azure abhängig. Diese Änderung bietet OpenAI mehr Flexibilität in Forschung und Entwicklung sowie beim Modelltraining. Die neue Vereinbarung passt auch die Exklusivitätsklausel für Rechenressourcen an, wobei Microsoft ein Vorkaufsrecht erhält.

【AiBase-Zusammenfassung:】

🌟 OpenAI erhält Zugriff auf die Rechenressourcen von Wettbewerbern und ist nicht mehr nur von Microsoft abhängig.

🤝 Die neue Vereinbarung passt die Exklusivität der Rechenressourcen an, wobei Microsoft ein Vorkaufsrecht erhält.

💼 Die Beziehung zwischen den beiden Unternehmen hat Schwankungen erlebt, OpenAI arbeitet mit anderen Unternehmen zusammen, um seinen Rechenbedarf zu decken.

9. Bericht: ByteDance plant, 2025 12 Milliarden US-Dollar in KI-Chips zu investieren

ByteDance verstärkt seine Investitionen im Bereich der Künstlichen Intelligenz, um seine Wettbewerbsfähigkeit zu steigern. Das Unternehmen plant, im Jahr 2025 über 12 Milliarden US-Dollar in die Forschung und den Kauf von KI-Chips zu investieren, was seine Bedeutung für KI-Technologien zeigt. Darüber hinaus beträgt das Budget des Unternehmens in diesem Jahr für KI-Infrastruktur 40 Milliarden RMB, das Doppelte des Vorjahres, und es plant, 68 Milliarden US-Dollar in Überseemärkten zu investieren, hauptsächlich für den Kauf von Nvidia-Chips, um die Trainingsfähigkeit von Basismodellen zu verbessern.

【AiBase-Zusammenfassung:】

🌟 ByteDance plant, 2025 über 12 Milliarden US-Dollar in die Entwicklung von KI-Chips zu investieren, was die Bedeutung von KI-Technologien unterstreicht.

💰 ByteDance hat in diesem Jahr ein Budget von 40 Milliarden RMB für KI-Infrastruktur veranschlagt, das Doppelte des Vorjahres.

🌍 Das Unternehmen plant außerdem, 68 Milliarden US-Dollar in Überseemärkten zu investieren, um Nvidia-Chips zu kaufen und die Trainingsfähigkeit von Basismodellen zu verbessern.

10. Französisches KI-Startup Mistral plant Börsengang statt Übernahme

Das französische Startup Mistral AI gab kürzlich bekannt, einen Börsengang zu planen, was eine neue Entwicklung im Bereich der Open-Source-KI darstellt. CEO Arthur Mensch betonte, dass das Unternehmen nicht zum Verkauf steht, obwohl es Gerüchte über eine Übernahme durch Microsoft gab. Mistral ist seit seiner Gründung im Jahr 2023 schnell gewachsen, verfügt über ausreichende Finanzmittel und plant, seine Geschäftstätigkeit auf die asiatisch-pazifische Region auszuweiten, wobei der erste Standort in Singapur eingerichtet werden soll.

【AiBase-Zusammenfassung:】

💼 Mistral AI plant einen Börsengang, der CEO gibt an, dass das Unternehmen nicht zum Verkauf steht.

🌏 Zur Markterweiterung wird Mistral ein Büro in Singapur als ersten Standort in der asiatisch-pazifischen Region eröffnen.

💰 Mistral ist seit seiner Gründung schnell gewachsen, verfügt über ausreichende Finanzmittel und benötigt keine Finanzierung.

11. Bericht: Google investiert erneut über 1 Milliarde US-Dollar in Anthropic

Google gab kürzlich bekannt, über 1 Milliarde US-Dollar in das KI-Startup Anthropic zu investieren, was das Vertrauen von Google in das Unternehmen zeigt. Anthropic führt eine Finanzierungsrunde von fast 2 Milliarden US-Dollar durch, wobei der Unternehmenswert auf 60 Milliarden US-Dollar geschätzt wird. Angesichts des zunehmenden Wettbewerbs in der KI-Branche benötigen die Entwicklung großer Sprachmodelle enorme Finanzmittel und Spitzenkräfte, was Anthropic vor größere Herausforderungen stellt.

【AiBase-Zusammenfassung:】

💰 Google investiert über 1 Milliarde US-Dollar in das KI-Startup Anthropic, was das Vertrauen in die Zukunftsaussichten des Unternehmens zeigt.

📈 Anthropic führt eine Finanzierungsrunde von fast 2 Milliarden US-Dollar durch, wobei der Unternehmenswert auf 60 Milliarden US-Dollar geschätzt wird.

🖥️ Der zunehmende Wettbewerb in der KI-Branche erfordert für die Entwicklung großer Sprachmodelle enorme Finanzmittel und Spitzenkräfte.