Willkommen beim AI-Tagesbericht! Hier finden Sie täglich einen Überblick über die Welt der Künstlichen Intelligenz. Wir präsentieren Ihnen täglich die wichtigsten Neuigkeiten aus dem KI-Bereich, mit Fokus auf Entwickler, um Ihnen zu helfen, Technologietrends zu verstehen und innovative KI-Produktanwendungen kennenzulernen.

Neue KI-Produkte hier entdecken:https://top.aibase.com/

1. Die offizielle Version des AIGC-Tools „Jichuang“ von der Suchmaschine von Bytedance ist online

Das AIGC-Tool „Jichuang“ der Suchmaschine von Bytedance ist offiziell online und bietet verschiedene Möglichkeiten zur Inhaltserstellung, darunter AI-Skriptgenerierung, intelligente Videobearbeitung und digitale Avatare. Die Plattform nutzt Deep Learning und Natural Language Processing. Benutzer müssen lediglich ein Thema eingeben, um qualitativ hochwertige Text- und Videoinhalte zu generieren. Die neuen Funktionen „Trend-Viralität“ und „Ein-Klick-Genehmigung“ helfen Kreativen, schnell auf Marktveränderungen zu reagieren und die Effizienz und die Konformität der Inhalte zu verbessern.

image.png

【AiBase Zusammenfassung:】

🌟 Jichuang unterstützt verschiedene Arten der Inhaltsgenerierung und steigert die Effizienz der Erstellung.

📊 Die neuen Funktionen „Trend-Viralität“ und „Ein-Klick-Genehmigung“ helfen Kreativen, schnell auf Marktveränderungen zu reagieren.

🎨 KI-Technologie revolutioniert die Inhaltserstellung und ermutigt Kreative, neue Tools zu erkunden.

Detaillierter Link:https://top.aibase.com/tool/douyinjichuang

2. Tongyi Wanxiang präsentiert 2.1 Videomodel mit deutlich verbesserter Fähigkeit zur Darstellung komplexer Bewegungen

Das von Alibaba entwickelte Tongyi Wanxiang-Videogenerierungsmodell wurde in der neuesten Version 2.1 umfassend aktualisiert und bietet eine Express- und eine Pro-Version, die sich auf hohe Leistung bzw. hervorragende Darstellung konzentrieren. Diese Version hat erhebliche Fortschritte bei der Verarbeitung komplexer Bewegungen und der Nachbildung realer physikalischer Gesetze erzielt und die Filmqualität und die Genauigkeit der Anweisungen verbessert.

image.png

【AiBase Zusammenfassung:】

🚀 Die neue Version umfasst eine Express- und eine Pro-Version für verbesserte Leistung und Darstellung.

🐱 Die generierten Videos sind detailreich und lösen das Problem der „Kritzeleien“, wodurch eine präzise Generierung von chinesischen und englischen Texten ermöglicht wird.

🎬 Die Kameraführung wirkt wie von einem Filmregisseur, mit automatischer Kameraeinstellung und verbesserter künstlerischer Gestaltung.

Detaillierter Link:https://tongyi.aliyun.com/wanxiang/videoCreation

3. Microsoft veröffentlicht offiziell das leistungsstarke kleine Modell Phi-4 als Open Source

Microsoft hat auf der Hugging Face-Plattform das kleine Sprachmodell Phi-4 mit 14 Milliarden Parametern veröffentlicht, das hervorragende Leistungen zeigt und mehrere bekannte Modelle wie GPT-4o und Llama-3.1 übertrifft. Phi-4 erzielte im Mathematik-Wettbewerb AMC 91,8 Punkte und im MMLU-Test 84,8 Punkte und zeigt damit seine starke Schlussfolgerungsfähigkeit. Das Modell verwendet eine innovative Methode zur Generierung synthetischer Daten und unterstützt eine Kontextlänge von bis zu 16k, wodurch es für Consumer-Hardware geeignet ist.

image.png

【AiBase Zusammenfassung:】

🧩 Das von Microsoft entwickelte Phi-4-Modell hat nur 14 Milliarden Parameter, übertrifft aber in Leistungstests mehrere bekannte Modelle wie GPT-4o und Llama-3.1.

📈 Phi-4 zeigt herausragende Leistungen in Mathematik und Schlussfolgerungsfähigkeit, insbesondere im AMC- und MMLU-Test.

🌍 Das Modell ist Open Source und für kommerzielle Zwecke freigegeben, was viele Entwickler und KI-Enthusiasten anzieht.

Detaillierter Link:https://huggingface.co/microsoft/phi-4

4. Neue Videoreparaturtechnologie SeedVR: Unscharf wird hochauflösend, Bearbeitung beliebig langer Videos möglich

Vor dem Hintergrund der rasanten Entwicklung digitaler Medien ist die Verbesserung der Videoqualität zu einem wichtigen Thema geworden. Die von der Nanyang Technological University und dem ByteDance-Forschungsteam entwickelte SeedVR-Technologie verbessert die Videowiederherstellung deutlich, insbesondere bei der Verarbeitung von KI-generierten Videos, durch einen innovativen Mechanismus der beweglichen Fenster-Aufmerksamkeit. Die Technologie kann nicht nur Videos beliebiger Länge verarbeiten, sondern auch Bilddetails effektiv reparieren und dem Benutzer ein realistischeres Seherlebnis bieten.

image.png

【AiBase Zusammenfassung:】

🌟 SeedVR nutzt einen Mechanismus der beweglichen Fenster-Aufmerksamkeit und verbessert die Verarbeitung langer Videosequenzen.

🎥 Die Technologie verwendet eine größere Fenstergröße, wodurch die Wiederherstellungsqualität von hochauflösenden Videos deutlich verbessert wird.

🚀 In Kombination mit verschiedenen modernen Technologien zeigt SeedVR in mehreren Benchmark-Tests hervorragende Leistungen, insbesondere bei KI-generierten Videos.

Detaillierter Link:https://iceclear.github.io/projects/seedvr/

5. Adobe TransPixar integriert nahtlos transparente Effekte wie Rauch und Reflexionen in Szenen

Das von Adobe Research und der Hong Kong University of Science and Technology gemeinsam entwickelte TransPixar-System revolutioniert die Erstellung visueller Effekte, insbesondere bei der Verarbeitung transparenter Elemente. Die Technologie generiert visuelle Effekte mit Alphakanal und verbessert so die Effizienz und reduziert die Kosten. Die Einführung von TransPixar erfolgt zu einem Zeitpunkt, an dem die Nachfrage nach hochwertigen Spezialeffekten stark zunimmt, und deutet auf einen Wandel in den zukünftigen Filmherstellungsprozessen hin.

【AiBase Zusammenfassung:】

🌟 TransPixar generiert mithilfe innovativer KI-Technologie mit begrenzten Trainingsdaten hochwertige transparente Effekte und vereinfacht den Workflow der Spezialeffektproduktion.

💡 Das System steigert nicht nur die Effizienz großer Produktionsteams, sondern senkt auch die Produktionskosten für kleine Studios und ermöglicht die Realisierung komplexer Spezialeffekte.

🚀 TransPixar zeigt großes Potenzial im Bereich der Echtzeitanwendungen und kann transparente Effekte schnell generieren, was für Videospiele und Augmented Reality geeignet ist.

6. ByteDance und Universitäten präsentieren STAR-Modell: Verbesserung der Videoauflösung und -schärfe

Das von einem Forschungsteam der Nanjing University, ByteDance und der Southwest University entwickelte STAR-Technologie verbessert die Qualität von Videos mit niedriger Auflösung durch ein Text-zu-Video-Modell. Die Technologie kombiniert räumlich-zeitliche Verbesserungsmethoden und eignet sich für Videos mit niedriger Auflösung, die von Videoplattformen heruntergeladen wurden. Das Forschungsteam hat bereits ein vortrainiertes Modell und Inferenzcode auf GitHub veröffentlicht, die einfach zu verwenden sind und die Entwicklung im Bereich der Videoverarbeitung vorantreiben.

image.png

【AiBase Zusammenfassung:】

🌟 Die neue Technologie STAR kombiniert ein Text-zu-Video-Modell und erreicht eine Superauflösung von Videos, wodurch die Videoqualität verbessert wird.

🛠️ Das Forschungsteam hat ein vortrainiertes Modell und Inferenzcode veröffentlicht, die einfach zu verwenden sind.

📩 Kontaktinformationen werden bereitgestellt, um Benutzer zur Kommunikation und zum Austausch mit dem Forschungsteam zu ermutigen.

Detaillierter Link:https://github.com/NJU-PCALab/STAR

7. Stability AI präsentiert SPAR3D: 3D-Objekte aus einem einzigen Bild in einer Sekunde generieren

Auf der CES präsentierte Stability AI SPAR3D, eine innovative zweistufige 3D-Generierungstechnologie, die in weniger als einer Sekunde präzise 3D-Objekte aus einem einzigen Bild generieren kann. SPAR3D bietet nicht nur eine effiziente Methode zum Erstellen von 3D-Prototypen, sondern ermöglicht auch die Bearbeitung der generierten 3D-Objekte in Echtzeit, wodurch die Flexibilität der Gestaltung erhöht wird.

image.png

【AiBase Zusammenfassung:】

⚡ Echtzeit-Generierung: SPAR3D kann innerhalb einer Sekunde aus einem einzigen Bild ein vollständiges 3D-Objekt generieren und unterstützt die schnelle Bearbeitung.

🔍 Präzise Strukturvorhersage: Bietet präzise geometrische Formen und eine 360-Grad-Ansicht, einschließlich verdeckter Bereiche, um eine hochauflösende Ausgabe zu gewährleisten.

🚀 Offene Nutzungsrichtlinien: Unterstützt kommerzielle und nicht-kommerzielle Zwecke. Benutzer können das Modell auf verschiedene Weise erhalten und verwenden.

Detaillierter Link:https://stability.ai/news/stable-point-aware-3d

8. 238 generative KI-Dienste haben die Registrierung bei der Cyberspace Administration of China abgeschlossen

Das staatliche Internetinformationsamt gab am 8. Januar bekannt, dass bis zum 31. Dezember 2024 302 Dienste registriert wurden, darunter 238 neue Dienste im Jahr 2024. Dies zeigt die rasante Entwicklung des Sektors und die zunehmende Anerkennung neuer Dienste durch die Behörden. Die Bekanntmachung fordert Unternehmen, die Dienste mit Meinungsbildungscharakter anbieten, zur Registrierung auf und zur Verbesserung der Transparenz bereits bestehender Anwendungen, um die Einhaltung der Vorschriften und die Sicherheit zu gewährleisten.

【AiBase Zusammenfassung:】

🌟 Im Jahr 2024 wurden 302 generative KI-Dienste bei der Cyberspace Administration of China registriert, davon 238 neu.

🔍 Unternehmen, die Dienste mit Meinungsbildungscharakter anbieten, können sich über die zuständigen Cyberspace-Behörden registrieren lassen, um die Einhaltung der Vorschriften zu gewährleisten.

📝 Bereits online verfügbare Anwendungen müssen die verwendeten, registrierten Dienstinformationen veröffentlichen, um die Transparenz zu erhöhen.

9. Hurun-Liste der 50 stärksten chinesischen KI-Unternehmen 2024: iFLYTEK auf Platz 2, SenseTime auf Platz 3

Die Hurun-Liste der 50 stärksten chinesischen KI-Unternehmen 2024 wurde veröffentlicht. Cambrian erreichte mit einer Bewertung von 238 Milliarden RMB den ersten Platz und unterstreicht seine Stärke im KI-Bereich. iFLYTEK und SenseTime folgen mit Bewertungen von 116 Milliarden bzw. 50 Milliarden RMB. Die Liste zeigt, dass Peking, Shanghai und Shenzhen die wichtigsten Zentren für KI-Unternehmen sind und zusammen 80 % der gelisteten Unternehmen ausmachen.

【AiBase Zusammenfassung:】

🌟 Cambrian belegt mit einer Bewertung von 238 Milliarden Yuan den ersten Platz, gefolgt von iFLYTEK und SenseTime auf den Plätzen zwei und drei.

🏙️ Peking, Shanghai und Shenzhen sind die wichtigsten Zentren für KI-Unternehmen und machen zusammen 80 % der gelisteten Unternehmen aus.

📊 Die Liste konzentriert sich auf Unternehmen im Bereich der nicht-körperlichen KI und umfasst keine Unternehmen aus den Bereichen Robotik und Smart Home.

10. Unglaublich! Wiederholte einfache Anweisungen beschleunigen die KI-Codegenerierung um das 100-fache

Max Woolf, Senior Data Scientist bei BuzzFeed, führte ein Experiment mit dem Sprachmodell Claude 3.5 durch. Durch wiederholte Aufforderungen zur Codeverbesserung konnte er die Laufzeit von ursprünglich 657 Millisekunden auf 6 Millisekunden reduzieren – eine Steigerung der Leistung um das 100-fache. Das Experiment zeigte das einzigartige Verständnis des AI für „besseren Code“ und die automatische Hinzufügung von Unternehmensmerkmalen.

【AiBase Zusammenfassung:】

🌟 KI verbessert die Codeleistung durch wiederholte Anweisungen. Die Laufzeit des ursprünglichen Codes wurde von 657 Millisekunden auf 6 Millisekunden reduziert.

💡 KI fügt dem Code automatisch Unternehmensmerkmale hinzu und zeigt so sein einzigartiges Verständnis von „besserem Code“.

🛠️ Prompt Engineering ist weiterhin wichtig. Präzise Anweisungen können die Ergebnisgenerierung beschleunigen, erfordern aber dennoch eine Überprüfung und Korrektur durch menschliche Entwickler.

11. Nvidia präsentiert Groot Teleop-Technologie: Robotertraining über Apple Vision Pro

Nvidia präsentierte auf der CES eine Reihe von Innovationen zur Beschleunigung der Entwicklung humanoider Roboter, insbesondere im Industrie- und Fertigungsbereich. Mit dem Isaac GR00T-Blueprint können Entwickler mithilfe von Imitationslernen große Mengen synthetischer Bewegungsdaten generieren, um humanoide Roboter zu trainieren. Diese Technologie reduziert nicht nur den Zeit- und Kostenaufwand für die Datenerfassung, sondern generiert auch über die Cosmos-Plattform physikbewusste Videos und fördert die Entwicklung der physikalischen KI.

image.png

【AiBase Zusammenfassung:】

🚀 Nvidia präsentiert den Isaac GR00T-Blueprint, der mithilfe von Imitationslernen synthetische Bewegungsdaten generiert und die Entwicklung humanoider Roboter beschleunigt.

📊 Die Cosmos-Plattform wurde mit 18 Billionen Daten trainiert und generiert physikbewusste Videos, die die Entwicklung der physikalischen KI fördern.

🤝 Mehrere Roboterunternehmen setzen bereits die Isaac GR00T-Technologie ein und zeigen gute Anwendungsergebnisse.

12. Erschreckende Erfindung! Ingenieur baut mit ChatGPT ein Robotergewehr, OpenAI greift sofort ein

Kürzlich entwickelte der Ingenieur STS3D ein Robotergewehr, das mit ChatGPT-Anweisungen gezielt schießen kann und eine erstaunliche Reaktionsgeschwindigkeit und Genauigkeit aufweist. Diese Erfindung hat breite Diskussionen ausgelöst, insbesondere über die Besorgnis, Science-Fiction-Technologie in die Realität umzusetzen. OpenAI reagierte umgehend und wies darauf hin, dass dieses Verhalten gegen die Unternehmensrichtlinien verstößt und die Nutzung seiner Dienste zur Entwicklung von Waffen untersagt ist.

【AiBase Zusammenfassung:】

🌐 OpenAI trennt sich umgehend vom Ingenieur, der das Robotergewehr entwickelt hat, da er gegen die Nutzungsbedingungen verstoßen hat.

🤖 Das Robotergewehr von STS3D kann auf ChatGPT-Anweisungen gezielt schießen und zeigt eine hohe Genauigkeit.

⚔️ Obwohl OpenAI seine Richtlinien im vergangenen Jahr geändert hat, ist die Verwendung seiner Dienste zur Entwicklung jeglicher Art von Waffen weiterhin verboten.