Willkommen beim AI-Tagesbericht! Hier finden Sie täglich Ihre Orientierungshilfe in der Welt der Künstlichen Intelligenz. Wir präsentieren Ihnen täglich die wichtigsten Themen aus dem KI-Bereich, mit Fokus auf Entwickler, damit Sie technologische Trends verstehen und innovative KI-Produktanwendungen kennenlernen.

Neue KI-Produkte hier entdecken:https://top.aibase.com/

1. Li Auto AI-Großmodell-App steht kurz vor dem Start! „Li Xiang Tongxue“ zieht auf Ihr Smartphone und wird Ihr Allround-Lebensassistent

Li Xiang, CEO von Li Auto, gab auf der Li Auto AI Talk 2024 bekannt, dass die KI-Großmodell-App „Li Xiang Tongxue“ am 27. Dezember offiziell starten wird. Diese App erweitert das intelligente Erlebnis vom Fahrzeug auf das Smartphone und bietet praktische Funktionen als Lebensassistent. Die Beta-Version zeigt bereits beeindruckende Fähigkeiten in der Objekterkennung und Verarbeitung natürlicher Sprache. Sie kann schnell Fragen beantworten und Alltagsgegenstände erkennen.

image.png

【AiBase Zusammenfassung:】

🚗 Die Li Xiang Tongxue App erweitert das intelligente Erlebnis vom Fahrzeug aufs Smartphone und wird zum Allround-Lebensassistenten.

🔍 Die App verfügt über eine leistungsstarke Objekterkennung und liefert schnell relevante Informationen und Lösungen.

📱 Der Start von Li Xiang Tongxue markiert die aktive Erweiterung des KI-Ökosystems von Li Auto und steigert die Benutzerfreundlichkeit.

2. Deepseek V3 Open Source! Mehrsprachige Programmierfähigkeiten steigen sprunghaft an und übertreffen Claude3.5Sonnet V2

Das mit Spannung erwartete Deepseek V3 ist endlich Open Source und zeigt herausragende mehrsprachige Programmierfähigkeiten, die Konkurrenten wie Claude3.5Sonnet V2 übertreffen. Die Erfolgsrate im Aider-Mehrsprachen-Programmiertest stieg von 17% (V2.5) auf 48%, was einen deutlichen Fortschritt darstellt. Deepseek V3 verwendet eine Mixed-Expert-Architektur mit 685 Milliarden Parametern, wodurch das Modell komplexe Aufgaben effizienter bewältigen kann.

image.png

【AiBase Zusammenfassung:】

🌟 Deepseek V3 zeigt im mehrsprachigen Programmiertest eine hervorragende Leistung mit einer Erfolgsrate von 48%.

🧠 Die Architektur mit 685 Milliarden Parametern verbessert die Rechenleistung des Modells.

🔧 Open Source bringt neue Dynamik in die KI-Community und fördert die intelligente Weiterentwicklung verschiedener Branchen.

Detaillierter Link:https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main

3. Xiaomi beschleunigt den Aufbau von KI-Großmodellen und errichtet einen GPU-Cluster mit zehntausenden Karten

Xiaomi baut aktiv einen GPU-Cluster mit zehntausenden Karten auf und investiert massiv in KI-Großmodelle, was Entschlossenheit und Stärke im KI-Bereich zeigt. Das Xiaomi-Team für Großmodelle verfügt seit seiner Gründung über 6500 GPUs, und das Projekt läuft bereits seit mehreren Monaten. Lei Jun spielte dabei eine Schlüsselrolle. Der Beitritt von Luo Fuli, der Hauptentwicklerin von DeepSeek-V2, könnte Xiaomis Innovationen und Anwendungen im Bereich KI weiter vorantreiben.

【AiBase Zusammenfassung:】

🚀 Xiaomi baut einen GPU-Cluster mit zehntausenden Karten auf und erhöht die Investitionen in KI-Großmodelle.

🔍 Luo Fuli kommt zu Xiaomi und könnte das Großmodell-Team leiten und technologische Innovationen vorantreiben.

📈 Xiaomis KI-Technologie deckt verschiedene Bereiche ab und wird schrittweise in verschiedenen Geschäftsbereichen eingesetzt.

4. Jieyue Xingchen veröffentlicht das Bildgenerierungsmodell Step-1X-Medium mit neuen Funktionen wie Bild-zu-Bild-Generierung

Die Shanghai Jieyue Xingchen Intelligent Technology Co., Ltd. hat die Version Step-1X-Medium ihres Bildgenerierungsmodells veröffentlicht, die die Generierungsgeschwindigkeit und die Konsistenz zwischen Bild und Text deutlich verbessert. Die neue Version unterstützt die Funktion „Bild-zu-Bild-Generierung“, mit der Benutzer durch einfache Anweisungen Bilddetails verbessern und den Stil ändern können. Darüber hinaus wurde die Fähigkeit zur Gestaltung im chinesischen Stil verbessert, um die östliche Ästhetik besser einzufangen.

image.png

【AiBase Zusammenfassung:】

🚀 30% schnellere Generierung, deutlich verbessertes Verständnis und Konsistenz zwischen Bild und Text.

🎨 Neue „Bild-zu-Bild“-Funktion zur Verbesserung von Details, Stiländerung und lokalen Modifikationen.

🖌️ Verbesserte Gestaltung im chinesischen Stil, optimierte Darstellung ostasiatischer Personen, um die Anforderungen des Marken Designs zu erfüllen.

Detaillierter Link:https://platform.stepfun.com/

5. ChatGPT-Suchfunktion birgt potenzielle Risiken: Mögliche Manipulation durch böswillige Akteure zur Ausgabe unzuverlässiger Inhalte

Eine kürzlich durchgeführte Untersuchung hat potenzielle Sicherheitslücken in der Suchfunktion von OpenAIs ChatGPT aufgedeckt. Es wurde festgestellt, dass ChatGPT bei der Verarbeitung von Webseiten-Zusammenfassungen durch versteckte Inhalte manipuliert werden kann, was zu falschen Bewertungen oder bösartigem Code führt. Diese versteckten Inhalte können Anweisungen von Dritten oder sogar Werbeinformationen sein, die die Beurteilung von ChatGPT beeinflussen. Experten warnen davor, dass dieses Risiko, wenn es nicht behoben wird, ein hohes Risiko für Benutzer darstellt.

【AiBase Zusammenfassung:】

🚨 ChatGPT kann durch versteckte Inhalte manipuliert werden und falsche Bewertungen liefern.

🔍 Versteckte Texte können die Bewertung von ChatGPT beeinflussen, selbst wenn die Seite negative Bewertungen enthält.

🛡️ OpenAI arbeitet aktiv an der Behebung potenzieller Probleme, um die Sicherheit des Suchwerkzeugs zu verbessern.

6. Tencent Research präsentiert ein neues Übersetzungsmodell DRT-o1, das die Übersetzung literarischer Texte neu definiert

Mit der zunehmenden Globalisierung wird die neuronale maschinelle Übersetzungstechnologie in der sprachübergreifenden Kommunikation immer wichtiger. Das von Tencent Research entwickelte Übersetzungssystem DRT-o1 konzentriert sich auf die Übersetzung literarischer Texte. Es verwendet ein Multi-Agent-Framework zur Optimierung der Behandlung von Metaphern und Analogien und verbessert so deutlich die Genauigkeit und den Fluss der Übersetzung. Die Ergebnisse zeigen eine deutliche Verbesserung der BLEU- und COMET-Werte und unterstreichen die Leistungsfähigkeit im Bereich der Literaturübersetzung.

image.png

【AiBase Zusammenfassung:】

🌟 Das DRT-o1-System umfasst zwei Versionen (7B und 14B) und verwendet ein Multi-Agent-Framework zur Optimierung der Übersetzung von Metaphern und Analogien.

📚 Das Forschungsteam extrahierte und selektierte 63.000 literarische Sätze aus 400 Büchern der Public Domain als Trainingsdaten.

🚀 DRT-o1 zeigt eine deutliche Verbesserung der BLEU- und COMET-Werte und beweist seine hohe Leistungsfähigkeit in der Literaturübersetzung.

Detaillierter Link:https://github.com/krystalan/DRT-o1

7. Luo Yonghao steigt in den KI-Bereich ein, sein Unternehmen sucht nach Talenten für KI-Großmodelle

Die jüngste Nachricht über Luo Yonghao, die für Aufsehen gesorgt hat, ist sein Einstieg in den KI-Bereich. Tatsächlich hat er die AR-Industrie aber nicht aufgegeben. Da die AR-Technologie noch Zeit braucht, um zu reifen, plant er zunächst die Einführung von KI-Produkten. Luo Yonghaos neues Unternehmen, Xi Hongxian Technology Co., Ltd., sucht aktiv nach Fachkräften im KI-Bereich, darunter KI-Ingenieure, Algorithmus-Ingenieure für Großmodelle usw.

image.png

【AiBase Zusammenfassung:】

🚀 Luo Yonghao gibt AR nicht auf, die Technologie braucht aber Zeit zur Reife, daher werden zuerst KI-Produkte eingeführt.

💼 Xi Hongxian Technology Co., Ltd. sucht KI-Ingenieure, Algorithmus-Ingenieure für Großmodelle, KI-Produktmanager usw.

🌐 Neue Produkte könnten auf den Überseemarkt ausgerichtet sein, daher werden auch Mitarbeiter für Social Media und grenzüberschreitenden E-Commerce gesucht.

8. Hu Yunhua, KI-Veteran, wechselt zu Zhipu und wird Leiter der C-End-Anwendung „Zhipu Qingyan“

Der Beitritt von Hu Yunhua bietet Zhipu Qingyan neue Entwicklungsmöglichkeiten. Seine umfassende Erfahrung und sein technischer Hintergrund im KI-Bereich werden dem Produkt helfen, sich in einem wettbewerbsintensiven Markt zu behaupten. Zhipu Qingyan steht derzeit vor den Herausforderungen des Nutzerwachstums und der Monetarisierung. Hu Yunhua muss effektive Strategien zur Produktdefinition und Nutzerbindung entwickeln.

【AiBase Zusammenfassung:】

🌟 Hu Yunhuas Beitritt zu Zhipu Qingyan markiert ein neues Kapitel in Bezug auf Technologie und Management.

📈 Zhipu Qingyan hat derzeit 25 Millionen Nutzer und ein geschätztes Jahreseinkommen von über 10 Millionen Yuan, steht aber vor einem harten Wettbewerb.

💡 Hu Yunhuas Erfahrung im KI-Bereich und seine Erfahrung in großen Unternehmen bieten eine starke Unterstützung für die Produktentwicklung von Zhipu Qingyan.

9. Nvidias GB300/B300-GPU kommt auf den Markt! Die Inferenzleistung steigt sprunghaft an, die Lieferkette wird neu geordnet

Nur sechs Monate nach der Einführung der GB200 und B200 hat Nvidia die neuen GPUs GB300 und B300 vorgestellt. Diese neuen Produkte bieten eine deutliche Verbesserung der Inferenzleistung, insbesondere in Bezug auf Speicher und Rechenleistung. Die FLOPS-Leistung der B300 wurde um 50% gesteigert, die Speicherkapazität auf 288 GB erhöht und die Speicherbandbreite bei 8 TB/s gehalten. In Bezug auf die Lieferkette wechselt Nvidia zu SXM-Puck-Modulen, wodurch mehr OEMs und ODMs an der Produktion beteiligt werden können.

image.png

【AiBase Zusammenfassung:】

⚡ Die B300-GPU verwendet das 4NP-Verfahren von TSMC, die FLOPS-Leistung wurde im Vergleich zur B200 um 50% gesteigert und der Speicher auf 288 GB erhöht.

💡 Die NVL72-Architektur ermöglicht die Zusammenarbeit von 72 GPUs, wodurch die Inferenzleistung und Interaktivität verbessert und die Latenz reduziert wird.

🔗 Die Umstrukturierung der Lieferkette ermöglicht die Beteiligung weiterer OEMs und ODMs, was die Gewinnmarge von Nvidia möglicherweise beeinträchtigen könnte.

Detaillierter Link:https://semianalysis.com/2024/12/25/nvidias-christmas-present-gb300-b300-reasoning-inference-amazon-memory-supply-chain/

10. Musk prognostiziert: Die KI-Intelligenz wird 2025 die eines einzelnen Menschen und 2030 die aller Menschen übertreffen

Milliardär Elon Musk veröffentlichte auf der Social-Media-Plattform X seine neuesten Prognosen zur Künstlichen Intelligenz und sagte voraus, dass die KI-Technologie in den nächsten Jahren erstaunliche Fortschritte machen werde. Er erwartet, dass die KI-Intelligenz bis Ende 2025 die Intelligenz jedes einzelnen Menschen übertreffen wird, und dass die KI zwischen 2027 und 2028 möglicherweise die gesamte menschliche Intelligenz übertreffen wird. Diese Prognose hat breite Aufmerksamkeit erregt, insbesondere die Diskussion über die potenziellen Risiken der KI.

【AiBase Zusammenfassung:】

🌟 Bis Ende 2025 wird die KI-Intelligenz voraussichtlich die eines einzelnen Menschen übertreffen.

🚀 Zwischen 2027 und 2028 könnte die KI die gesamte menschliche Intelligenz übertreffen.

⚠️ Die zukünftige Entwicklung der KI könnte mehr Schaden als Nutzen bringen, daher müssen die potenziellen Risiken berücksichtigt werden.

11. Künstliche Intelligenz kommentiert Fußballspiele: Kann Fouls erkennen, deren Schweregrad einschätzen und Kommentare abgeben

Forscher der Shanghai Jiao Tong University und Alibaba haben gemeinsam MatchVision entwickelt, ein neues KI-System, das Fußballspiele verfolgen, wichtige Spielzüge erkennen und Kommentare wie ein menschlicher Kommentator liefern kann. Das System basiert auf dem umfangreichen Datensatz SoccerReplay-1988 und erreicht eine Genauigkeit von 84%. Die Studie zeigt, dass sich KI und menschliche Kommentatoren in ihren Schwerpunkten unterscheiden. Künftig könnte das System auf die automatische Erstellung von Spielzusammenfassungen und die Unterstützung von Schiedsrichtern ausgeweitet werden.

QQ20241226-095420.png

【AiBase Zusammenfassung:】

🔍 Das MatchVision-System kann 24 verschiedene Spielereignisse erkennen, darunter Tore und Fouls, mit einer Genauigkeit von 84%.

🗣️ KI und menschliche Kommentatoren unterscheiden sich in ihren Schwerpunkten. KI konzentriert sich eher auf technische Details, während Menschen eher auf Emotionen achten.

📊 Das Forschungsteam plant, den Datensatz und das Modell Open Source bereitzustellen, damit mehr Forscher und Entwickler ihn nutzen können.

12. Überblick über die 5 größten KI-Innovationen von Google im Jahr 2024

Im Jahr 2024 hat Google bemerkenswerte Fortschritte im Bereich der Künstlichen Intelligenz erzielt und mehrere innovative Technologien vorgestellt. Diese Technologien haben nicht nur die Benutzererfahrung verbessert, sondern auch die Grenzen der Technologie erweitert. Gemini 2.0 führte die Agentenfunktion ein, Veo2 veränderte die Art und Weise, wie Videomaterial generiert wird, das Mariner-Projekt verbesserte die Mensch-Maschine-Interaktion, LearnLM bietet personalisierte Unterstützung im Bildungsbereich und NotebookLM hilft Benutzern, Informationen besser zu verwalten.

【AiBase Zusammenfassung:】

🌟 Gemini 2.0 führt die Agentenfunktion ein, ermöglicht multimodales Denken und verbessert die Benutzerinteraktion.

🎥 Veo2 setzt neue Maßstäbe für die Videogenerierung und liefert qualitativ hochwertige, kontextuell präzise Inhalte.

📚 LearnLM verbessert das Lernerlebnis durch personalisierte KI-Tutoren und unterstützt Schüler und Pädagogen.