Willkommen bei der Rubrik „AI-Tagesbericht“! Hier finden Sie täglich neue Informationen über die Welt der Künstlichen Intelligenz. Wir präsentieren Ihnen täglich die wichtigsten Themen aus dem KI-Bereich, mit Fokus auf Entwickler, damit Sie technologische Trends erkennen und innovative KI-Produktanwendungen kennenlernen.

Neue KI-Produkte hier entdecken: https://top.aibase.com/

1. Zhipu AI senkt Preise für seine gesamte Modellmatrix; Qingyan Intelligente Agenten-Zentrum startet mit Luo Yonghao „AI Lao Luo“

Zhipu AI gab auf dem Zhipu AI Open Day bekannt, dass die Preise für mehrere Modelle deutlich gesenkt wurden. Seine Qingyan App verzeichnet über 300.000 aktive intelligente Agenten mit einer täglichen Token-Aufrufmenge von 40 Milliarden. Luo Yonghaos KI-Agent ist offiziell im Qingyan App-Agenten-Zentrum eingezogen (Mitarbeiter-Nr. 001) und für die Öffentlichkeit zugänglich.

【AiBase Zusammenfassung:】

🚀 Die Preise für die Modelle GLM-4-Air und GLM-3-Turbo wurden von Zhipu AI auf 0,6 Yuan/Million Tokens gesenkt. Das Embedding-2-Modell kostet 0,3 Yuan/Million Tokens.

💡 Der Preis für das GLM-4-Flash-Modell wurde auf bis zu 0,06 Yuan/Million Tokens reduziert.

📈 Die Qingyan App hat über 300.000 aktive intelligente Agenten mit einer täglichen Token-Aufrufmenge von 40 Milliarden.

Detaillierter Link: https://top.aibase.com/tool/zhipuqingyan

2. ComfyUI Zeitachsen-System TimeUi: Inhalte schnell hinzufügen, löschen oder neu anordnen

Dieser Artikel beschreibt TimeUi, ein ComfyUI Zeitachsen-System mit einer Benutzeroberfläche ähnlich der einer Videobearbeitungssoftware. Benutzer können Inhalte schnell hinzufügen, löschen oder neu anordnen, was für ein flüssiges Benutzererlebnis sorgt. TimeUi bietet praktische Funktionen zum Hochladen und Verwalten von Bildern, unterstützt benutzerdefinierte Einstellungen und verschiedene Parameteranpassungen, verschiedene Zeitformate und Dauerangaben sowie Bezier-Kurven, um ein leistungsstarkes und flexibles Zeitachsen-Knotensystem zu bieten.

image.png

【AiBase Zusammenfassung:】

⭐ Benutzer können Bilder direkt in Knoten hochladen oder weitere „Bild hochladen“-Knoten hinzufügen, um den Workflow zu vereinfachen.

⭐ Jede Zeitachsenzeile enthält verschiedene benutzerdefinierte Einstellungen, z. B. das Umschalten der Sichtbarkeit von Bildmasken, um die Ausgabe einfach zu optimieren.

⭐ Das Zeitformat und die Animationsdauer der Zeitachse können geändert werden, wobei die Auswahl zwischen Frames oder Sekunden möglich ist. Bezier-Kurven werden ebenfalls unterstützt.

Produktzugang: https://top.aibase.com/tool/timeui-a-comfyui-timeline-node

Details: https://www.chinaz.com/2024/0605/1621434.shtml

3. Der stärkste Assistent ist da! Backseat AI: Der kostenlose KI-Spielbegleiter für League of Legends

Backseat AI ist ein von Riot Games genehmigter, kostenloser KI-Begleiter, der speziell für League of Legends-Spieler entwickelt wurde, um ihnen zu helfen, ihre Spielerfahrung zu verbessern. Spieler erhalten über Sprachüberlagerungen und In-Game-Kommentare Echtzeit-Spielratschläge, einschließlich Kaufempfehlungen und Strategien für die Laning-Phase. Der KI-Begleiter beansprucht nicht zu viele Systemressourcen und unterstützt die Arbeit und Entwicklung von Content Creators.

【AiBase Zusammenfassung:】

🎮 Bietet Echtzeit-Spielkommentare und -vorschläge, einschließlich Kaufempfehlungen und Strategien für die Laning-Phase.

🤖 Zu den Hauptfunktionen gehören Echtzeit-Kommentare und Einblicke von Backseat Buddy, die Überprüfung von Spielzusammenfassungen in der Nachspiel-Lobby und Vorschläge vor dem Spiel, um den Spielern bei der Vorbereitung zu helfen.

💡 Zukünftige Versionen werden eine Echtzeit-Frage-und-Antwort-Funktion und verschiedene Sprachpakete von Content Creators enthalten, um mehr Sprachunterstützung und ein personalisierteres Erlebnis zu bieten.

Detaillierter Link: https://top.aibase.com/tool/backseat-ai

4. Mianbi Intelligence kündigt die kostenlose kommerzielle Nutzung des MiniCPM-Modells an

Mianbi Intelligence gab bekannt, dass sein „MiniCPM“-Modell für die kostenlose kommerzielle Nutzung freigegeben wird, um seinen Glauben an und seine Liebe zur Open-Source-Community zu demonstrieren. MiniCPM-Llama3-V2.5 ist ein besonderes Geschenk an die Open-Source-Community und ein vielbeachtetes, multimodales Modell für Endgeräte. Es eignet sich besonders gut für sehbehinderte Menschen und bietet eine leistungsstarke OCR-Funktion zur Verbesserung des Leseerlebnisses von Dokumenten.

image.png

【AiBase Zusammenfassung:】

🎁 MiniCPM-Llama3-V2.5 ist ein multimodales 8B-Modell für Endgeräte, das Gemini Pro und GPT-4V übertrifft und über 30 Sprachen unterstützt.

💼 MiniCPM und MiniCPM-V Modelle sind für die akademische Forschung freigegeben und dürfen kommerziell genutzt werden, unter der Bedingung, dass Apache2.0 und die „MiniCPM Model Community License Agreement“ eingehalten werden.

🚀 MiniCPM-Llama3-V2.5 verfügt über eine SOTA OCR-Funktion, läuft effizient auf Mobilgeräten und bietet eine 150-mal schnellere Bildcodierung.

Detaillierter Link: https://modelbest.feishu.cn/share/base/form/shrcnpV5ZT9EJ6xYjh3Kx0J6v8g

5. Datenanalyse zur Nutzung von Coze Bots

In diesem Artikel präsentiert der X-Blogger @eviljer eine Datenanalyse und Visualisierung von Coze Bots, wobei die hohe Nutzung in den Bereichen Spiele und Bildung hervorgehoben wird. Die Datenanalyse ermöglicht ein intuitives Verständnis der Popularität und Entwicklung verschiedener Kategorien.

image.png

【AiBase Zusammenfassung:】

📊 Spiele und Bildung sind mit 20,6 % bzw. 19,2 % am stärksten vertreten, auch Rollenspiele zeigen mit 11,9 % eine gute Performance.

📈 Die Daten zeigen eine konzentrierte Verteilung, wobei Lifestyle, Spiele und Effizienz-Tools führend sind, während der Bereich Lernen und Bildung noch Entwicklungspotenzial bietet.

📉 Die zehn wichtigsten Kategorien von Coze Bots umfassen Spiele, Lernen und Bildung, öffentliche Konfigurationen, Rollenspiele, Effizienz, Texterstellung, Bild- und Ton-Video, Lifestyle, Geschäftsdienste und Code-Assistenten.

6. True Fit nutzt generative KI, um Online-Käufern zu helfen, die richtige Kleidung zu finden

True Fit führt die neue Funktion „Fit Hub“ ein, die generative KI nutzt, um Online-Käufern zu helfen, Kleidung zu finden, die zu ihrer Figur passt. Es werden Informationen von Produktseiten integriert, um Käufern zu helfen, Artikel schnell zu verstehen und die richtige Größe zu bestimmen, wodurch die Retourenrate reduziert werden soll. Geplant sind weitere Funktionen wie „Shopper Insights“ und „Brand Sizing“, um ein noch stärker personalisiertes Einkaufserlebnis zu bieten.

image.png

【AiBase Zusammenfassung:】

⭐️ True Fit führt die neue Funktion „Fit Hub“ ein, die generative KI nutzt, um Online-Käufern zu helfen, Kleidung zu finden, die zu ihrer Figur passt.

⭐️ Fit Hub integriert Informationen von Produktseiten, um Käufern zu helfen, Artikel schnell zu verstehen und die richtige Größe zu bestimmen, wodurch die Retourenrate reduziert wird.

⭐️ Geplant sind weitere Funktionen wie „Shopper Insights“ und „Brand Sizing“, um ein noch stärker personalisiertes Einkaufserlebnis zu bieten.

7. Apple wird auf der WWDC iOS 18 mit umfassender Integration von KI-Technologien vorstellen

Apples auf der WWDC bevorstehende Vorstellung von iOS 18 wird eine umfassende Integration von KI-Technologien beinhalten und eine Reihe von mit Spannung erwarteten neuen Funktionen und Verbesserungen bringen. Das Update umfasst KI-Unterstützung für Siri, Apple Fotos, die Aufnahme- und Notizen-App, KI-Updates für iMessages und weitere KI-Funktionen, was Apples Engagement für die Integration von KI-Technologien in alle Aspekte des Betriebssystems zeigt.

【AiBase Zusammenfassung:】

🌟 Siri-Upgrade: Siri kann Funktionen innerhalb von Anwendungen steuern, sich mit der Apple Watch verbinden, bietet eine natürlichere und flüssigere Stimme und kann Benachrichtigungen zusammenfassen.

📸 Neue Funktionen in Apple Fotos: Die Benutzeroberfläche wurde komplett überarbeitet und enthält eine „Aufräumen“-Funktion. KI wird verwendet, um Fotos zu retuschieren, und die Generative Playground-Anwendung wird intern entwickelt.

🔊 KI-Unterstützung für die Aufnahme- und Notizen-App: KI fasst Notizen zusammen, transkribiert Audioinhalte in Notizen und Math Notes hilft beim Erstellen von Grafiken und beim Lösen von Gleichungen.

8. CamCo: 3D-konsistente Bild-zu-Video-Generierung mit Kamerakontrolle

Dieser Artikel beschreibt CamCo, ein neuartiges Bild-zu-Video-Generierungsframework, das durch die Einführung von Plücker-Koordinaten und epipolarer Beschränkungsaufmerksamkeit 3D-Konsistenz erreicht. Durch die Feinabstimmung mit strukturiertem Licht an realen Videos wird die Synthese von Objektbewegungen verbessert. CamCo bietet eine deutliche Verbesserung in Bezug auf Kamerakontrolle und 3D-Konsistenz und kann qualitativ hochwertige Videos mit sinnvollen Objektbewegungen erzeugen.

image.png

【AiBase Zusammenfassung:】

🔍 CamCo ist ein 3D-konsistentes Bild-zu-Video-Generierungsframework mit Kamerakontrolle, das 3D-Konsistenz durch die Einführung von Plücker-Koordinaten und epipolarer Beschränkungsaufmerksamkeit erreicht.

🔍 Die epipolare Beschränkungsaufmerksamkeit wird in jedem Aufmerksamkeitsmodul integriert. Durch die Feinabstimmung mit strukturiertem Licht an realen Videos wird die Synthese von Objektbewegungen verbessert.

🔍 CamCo verarbeitet reale Videos durch einen Datenfilterungsprozess, um die Fähigkeit zu verbessern, Videos mit Eigenbewegung der Kamera und dynamischen Objekten zu generieren.

Detaillierter Link: https://top.aibase.com/tool/camco

9. Nvidia RTX Remix Modder bringen kompatible ComfyUI-Knoten heraus

Die Nvidia RTX Remix Modder haben neue, mit ComfyUI kompatible Knoten veröffentlicht, die einen großen Fortschritt für die Erstellung von Spielmods und die Verbesserung von Ressourcen darstellen. Modder können im ComfyUI-Interface Spiel-Assets vergrößern und neu zeichnen, wodurch der Bearbeitungs- und Upgrade-Prozess vereinfacht wird. Dies bietet Superauflösung und PBR-Modelle, verbessert die Grafik des Spiels und steigert das immersive Spielerlebnis.

image.png

【AiBase Zusammenfassung:】

🎮 Modder können Spiel-Assets direkt im ComfyUI-Interface vergrößern und neu zeichnen, wodurch der Bearbeitungs- und Upgrade-Prozess vereinfacht wird.

🔧 Mit den neuen Knoten können Modder Spieltexturen aus RTX Remix in ComfyUI exportieren und mit KI-Modellen stapelweise verbessern.

🌟 Das RTX Remix Toolkit verfügt über eine leistungsstarke REST-API, die Moddern hilft, DirectX 8 und DirectX 9 Spiele zu modernisieren und neu zu erstellen, und die Innovation und Entwicklung von RTX-Remastering-Projekten vorantreibt.

Detaillierter Link: https://www.nvidia.com/en-us/geforce/news/rtx-remix-rest-api-comfyui-app-connectors/

10. Zhipu AI kündigt die Open-Source-Veröffentlichung des GLM-Modells der vierten Generation, GLM-4-9B, an

Das Zhipu AI-Team hat am 14. März 2023 das GLM-4-9B-Modell als Open Source veröffentlicht, was große Aufmerksamkeit erregte. Bei der Vorverarbeitung wurde ein großes Sprachmodell zur Datenfilterung eingesetzt, wodurch die Trainingseffizienz um das 3,5-fache gesteigert wurde. GLM-4-9B bietet eine leistungsstärkere Inferenzleistung, eine längere Kontextverarbeitungsfähigkeit, mehrsprachigen Support, Multimodalität und All Tools-Funktionen.

image.png

【AiBase Zusammenfassung:】

🚀 Das GLM-4-9B-Modell wurde als Open Source veröffentlicht und erregte große Aufmerksamkeit.

💡 Bei der Vorverarbeitung wurde ein großes Sprachmodell verwendet, wodurch die Trainingseffizienz um das 3,5-fache gesteigert wurde.

🔥 GLM-4-9B bietet eine starke Inferenzleistung, mehrsprachigen Support, Multimodalität und All Tools-Funktionen.

Detaillierter Link: https://github.com/THUDM/GLM-4

11. Musks Grok ist jetzt separat auf der xAI-Website zugänglich