Willkommen bei der Rubrik „AI-Tagesbericht“! Hier finden Sie täglich einen Überblick über die Welt der Künstlichen Intelligenz. Wir präsentieren Ihnen täglich aktuelle Themen aus dem KI-Bereich, mit Fokus auf Entwickler, damit Sie technische Trends verstehen und innovative KI-Produktanwendungen kennenlernen.
Neue KI-Produkte hier entdecken:https://top.aibase.com/
1. Kuaishou bringt die eigenständige AI-App „Keling AI“ heraus und verstärkt seine KI-Kreationsstrategie auf Mobilgeräten
Kuaishou hat kürzlich die eigenständige App „Keling AI“ vorgestellt, um den Bereich der KI-Kreationen auf Mobilgeräten auszubauen. Die App basiert auf Kuaishous selbst entwickelten großen Sprachmodellen Keling und KeTu und bietet Funktionen zur Generierung und Bearbeitung von Videos und Bildern. Obwohl die Funktionen im Vergleich zur Webversion eingeschränkt sind, hat sie bereits 3,6 Millionen Nutzer angezogen, die über 37 Millionen Videos und 100 Millionen Bilder erstellt haben. Sie konkurriert mit Douyins „Jimeng AI“-App.
【AiBase Zusammenfassung:】
🚀 Kuaishou bringt die eigenständige App „Keling AI“ heraus und erweitert damit seine KI-Kreationsstrategie auf Mobilgeräten.
💡 Die „Keling AI“-App basiert auf selbst entwickelten großen Sprachmodellen und bietet Funktionen zur Generierung und Bearbeitung von Videos und Bildern.
💪 Sie hat bereits 3,6 Millionen Nutzer angezogen, die über 37 Millionen Videos und 100 Millionen Bilder erstellt haben. Sie konkurriert mit Douyins „Jimeng AI“-App.
2. Zhipu AI veröffentlicht Open-Source-Version seines neuesten Videomodells CogVideoX v1.5
Das Zhipu-Technikteam hat die neueste Version seines Videogenerierungsmodells CogVideoX v1.5 veröffentlicht und als Open Source zur Verfügung gestellt. Diese Version bietet eine deutlich verbesserte Videogenerierungsfähigkeit, mit Unterstützung für 5/10 Sekunden lange Videos, 768P Auflösung und 16 Frames pro Sekunde. Die neue Qingying-Plattform wurde eingeführt und bietet in Kombination mit dem CogSound-Soundeffektmodell die Generierung von ultrahochauflösenden 4K-Videos. Verbesserte Datenverarbeitung und Algorithmen gewährleisten die Qualität und Kohärenz der Videos.
【AiBase Zusammenfassung:】
🚀 CogVideoX v1.5 ist als Open Source verfügbar und unterstützt 5/10 Sekunden lange Videos, 768P Auflösung und 16 Frames pro Sekunde.
🎬 Die neue Qingying-Plattform bietet in Kombination mit dem CogSound-Soundeffektmodell die Generierung von ultrahochauflösenden 4K-Videos.
🔬 Verbesserte Datenverarbeitung und Algorithmen gewährleisten die Qualität und Kohärenz der generierten Videos.
Detaillierter Link:https://github.com/thudm/cogvideo
3. Bericht: Baidu wird eine Smart Glasses mit integriertem KI-Assistenten auf Basis des Wenxin-Modells veröffentlichen
Baidu plant die Einführung einer Smart Glasses mit integriertem XiaoDu KI-Assistenten, die auf der Baidu World Conference 2024 vorgestellt werden soll. Die Brille bietet innovative Funktionen und ein völlig neues intelligentes Erlebnis.
【AiBase Zusammenfassung:】
🌟 Die Brille wird mit einer Kamera ausgestattet sein und Fotos und Videos aufnehmen können.
📷 Die Brille unterstützt die Sprachinteraktion basierend auf dem Ernie-Modell, um das Benutzererlebnis zu verbessern.
🗣️ Die Baidu Smart Glasses bieten eine personalisierte Lösung, die auf die Bedürfnisse chinesischer Nutzer zugeschnitten ist.
4. Für zahlende Spieler ein Fest! Krea AI startet Lora-Trainingsfunktion
Krea AI hat die Lora-Trainingsfunktion eingeführt, die Nutzern personalisierte Trainingsdienste für Charaktere, Stile und Produkte bietet. Nutzer können mehrere Bilder hochladen, um mit dem Training zu beginnen. Die Benutzeroberfläche ist einfach und intuitiv. Die Trainingsparameter sind einfach einzustellen und die Trainingsergebnisse sind gut, was die Funktion auch für Anfänger benutzerfreundlich macht. Die Mitgliedschaft kostet 10 US-Dollar pro Monat und erlaubt die kommerzielle Nutzung.
【AiBase Zusammenfassung:】
🔥 Krea AI führt die Lora-Trainingsfunktion ein, mit der Nutzer personalisierte Trainingsdienste für Charaktere, Stile und Produkte erstellen können.
💡 Die Benutzeroberfläche ist übersichtlich, nach dem Hochladen von Bildern können grundlegende Parameter eingestellt werden, der Trainingsprozess ist einfach und benutzerfreundlich.
💰 Die Mitgliedschaft kostet 10 US-Dollar pro Monat, ermöglicht die Generierung von 720 FLux-Bildern und 36.000 Echtzeitbildern und erlaubt die kommerzielle Nutzung.
Detaillierter Link:https://www.krea.ai/train
5. Keling führt Funktion zur Anpassung von Modellen ein und überwindet das Problem der Konsistenz von Charakteren bei der KI-Videogenerierung
Die kürzlich von Keling eingeführte Funktion zur Anpassung von Modellen stellt einen wichtigen Durchbruch im Bereich der KI-Videogenerierung dar und löst das Problem der Konsistenz von Charakteren. Diese Funktion ermöglicht es den Erstellern, mehrere Videoclips zum Training hochzuladen, wobei auch von Keling selbst generierte KI-Videos verwendet werden können, was mehr Flexibilität bietet. Nach dem Training kann das System Videos mit konsistenten Charakteren generieren und so vielfältige kreative Möglichkeiten eröffnen.
【AiBase Zusammenfassung:】
🔑 Ersteller können mehrere Videoclips zum Modelltraining hochladen und auch von Keling selbst generierte KI-Videos verwenden, was mehr Flexibilität bietet.
🚀 Nach dem Training kann das System Videos mit konsistenten Charakteren generieren, die eine 360-Grad-Drehung und stabile Erscheinungsmerkmale in komplexen Szenen aufweisen.
💡 Die Version KLING 1.5 unterstützt die Ausgabe von 1080p HD-Videos in verschiedenen Formaten und erfüllt so die Anforderungen verschiedener Plattformen. Ein Pinselwerkzeug für Bewegungen verbessert die Genauigkeit und Flexibilität der Videokreation.
6. Klein und leistungsstark! Das handliche visuelle KI-Modell moondream2 läuft auf dem Smartphone
Moondream hat moondream2 vorgestellt, ein leistungsstarkes, kompaktes visuelles Sprachmodell mit nur 1,6 Milliarden Parametern, das auf kleinen Geräten wie Smartphones laufen kann. Das Modell verfügt über leistungsstarke Funktionen zur Text- und Bildverarbeitung und schneidet in verschiedenen Benchmark-Tests hervorragend ab. Das Moondream-Team aktualisiert die Modellleistung kontinuierlich und hat erfolgreich 4,5 Millionen US-Dollar an Finanzmitteln beschafft. Der CEO verfügt über umfangreiche Erfahrung.
【AiBase Zusammenfassung:】
🌟 Moondream stellt moondream2 vor, mit nur 1,6 Milliarden Parametern, das auf kleinen Geräten wie Smartphones laufen kann.
💰 Moondream hat erfolgreich 4,5 Millionen US-Dollar an Finanzmitteln beschafft. Der CEO war bei Amazon tätig, und das Team aktualisiert und verbessert die Modellleistung kontinuierlich.
📈 moondream2 verfügt über leistungsstarke Funktionen zur Text- und Bildverarbeitung, kann Fragen beantworten, OCR durchführen, Objekte zählen und klassifizieren und schneidet in Benchmark-Tests hervorragend ab.
Detaillierter Link:https://huggingface.co/vikhyatk/moondream2
7. Xiaomi kündigt ein Upgrade des großen Sprachmodells XiaoAi an: Unterstützung für die „Musik-Frage-Antwort“-Funktion auf mehreren Geräten
Xiaomi hat offiziell ein Upgrade der Musikfunktionen des großen Sprachmodells XiaoAi angekündigt, mit der neuen Funktion „Musik-Frage-Antwort“. Nutzer können diese Funktion auf mehreren Geräten nutzen. Diese Funktion basiert auf Verbesserungen der KI-Funktionen und hilft Nutzern, Informationen zu Songs abzurufen und Fragen zu Fachwissen über Musik zu beantworten. XiaoAi hat im Juli dieses Jahres ein wichtiges Versions-Update erhalten, das die Funktionen für natürliche Fragen und Antworten und den intelligenten Assistenten umfassend verbessert und das Benutzererlebnis optimiert.
【AiBase Zusammenfassung:】
🎵 Xiaomi XiaoAi hat die Funktion „Musik-Frage-Antwort“ hinzugefügt, die die Suche nach Songinformationen und die Beantwortung von Fragen zu Fachwissen über Musik ermöglicht.
📱 Die Funktion ist auf mehreren Geräten verfügbar. Nutzer müssen XiaoAi auf die neueste Version aktualisieren.
🚗 In früheren Updates wurde XiaoAi umfassend verbessert, insbesondere die Funktionen für natürliche Fragen und Antworten sowie der intelligente Assistent, um das Benutzererlebnis zu optimieren.
8. Mistral AI bringt eine mehrsprachige API zur Inhaltsprüfung heraus und fordert OpenAI heraus
Mistral AI hat eine neue API zur Inhaltsprüfung vorgestellt, um mit den Branchenführern zu konkurrieren und Probleme der KI-Sicherheit und Inhaltsfilterung zu lösen. Die API basiert auf dem Ministral8B-Modell, kann verschiedene schädliche Inhalte erkennen, unterstützt mehrere Sprachen und wird bereits auf der Le Chat-Plattform eingesetzt. Mistral arbeitet mit mehreren Unternehmen zusammen und zeigt damit seine ausgereifte Technologie und seine europäische Perspektive.
【AiBase Zusammenfassung:】
🌍 Mehrsprachige Unterstützung: Die API unterstützt 11 Sprachen und erkennt schädliche Inhalte wie pornografische Inhalte und Hassreden.
🔗 Zusammenarbeit mit Unternehmen: Einsatz auf der Le Chat-Plattform und Zusammenarbeit mit Microsoft Azure, Qualcomm usw.
🔒 Technologischer Vorteil: Basierend auf dem Kontext von Konversationen wird die Erkennung potenziell schädlicher Inhalte verbessert.
Detaillierter Link:https://docs.mistral.ai/capabilities/guardrailing/
9. Die KI-„Elektronische Zunge“ ist da! Sie kann den Geschmack von Lebensmitteln erkennen und die Frische einfach überprüfen
Wissenschaftler haben erfolgreich ein neues Gerät namens „Elektronische Zunge“ entwickelt, das mithilfe von KI-Technologie verschiedene Kaffeemischungen genau unterscheiden und die Frische von Lebensmitteln und Getränken überprüfen kann. Dies bietet neue Lösungen für die Lebensmittelprüfung und Qualitätskontrolle. Die elektronische Zunge ahmt die menschliche Geschmackstechnologie nach, verbessert die Genauigkeit und die Arbeitseffizienz und kann die Geschmacksentwicklung beschleunigen und die Produktqualität gewährleisten. Sie verfügt über eine Funktion zur Überwachung der Lebensmittelfrische, schützt die Gesundheit der Verbraucher und die Qualitätskontrolle der Unternehmen. Die zukünftigen Anwendungsmöglichkeiten sind weitreichend und können auf die Bereiche Medizin und Umweltüberwachung ausgedehnt werden.
【AiBase Zusammenfassung:】
🌟 Die elektronische Zunge nutzt KI-Technologie, um verschiedene Kaffeemischungen genau zu unterscheiden.
🍽️ Sie überprüft die Frische von Lebensmitteln und Getränken und verhindert Verderb.
🔬 Zukünftig könnte die elektronische Zunge in Bereichen wie Medizin und Umweltüberwachung eingesetzt werden.
Detaillierter Link:https://www.nature.com/articles/s41586-024-08003-w
10. Google-Hightech ReCapture: Generiert mit einem Klick „Mehrkamera“-Videofilme
ReCapture ist eine innovative Technologie der Google-Forschungsabteilung, die durch die Neugenerierung von Videos mit benutzerdefinierten Kamerapfaden ermöglicht, dass Nutzer das ursprüngliche Video aus einer neuen Perspektive erleben können. Das zugrunde liegende Prinzip ist nicht komplex und nutzt ein mehrperspektivisches Diffusionsmodell und eine Maskierungs-Videofeinabstimmungstechnologie, um die Umwandlung von groben Videos in klare, kohärente und dynamische Videos zu ermöglichen. Die Google-Forscher gaben an, dass ReCapture keine großen Trainingsdatenmengen benötigt und für verschiedene Videos und Perspektivwechsel geeignet ist, sodass auch normale Nutzer problemlos professionelle „Mehrkamera“-Videos erstellen können.
【AiBase Zusammenfassung:】
🔍 Die ReCapture-Technologie ermöglicht es Nutzern, Videos neu zu erleben und eine neue Version mit benutzerdefinierten Kamerapfaden zu generieren.
🛠️ Mithilfe eines mehrperspektivischen Diffusionsmodells und einer Maskierungs-Videofeinabstimmungstechnologie werden grobe Videos in klare, kohärente und dynamische Videos umgewandelt.
🎥 ReCapture benötigt keine großen Trainingsdatenmengen und eignet sich für verschiedene Videos und Perspektivwechsel, sodass auch normale Nutzer professionelle „Mehrkamera“-Videos erstellen können.
Detaillierter Link:https://generative-video-camera-controls.github.io/
11. OpenAI gewinnt Urheberrechtsstreit – Legalisierung des Abrufens von KI-Daten im Trend?
Das Bezirksgericht des südlichen Bezirks von New York wies kürzlich die Klage von Raw Story Media, Inc. und AlterNet Media, Inc. gegen OpenAI wegen Urheberrechtsverletzung ab, da die Klage nicht zulässig sei. Dieses Urteil bedeutet einen wichtigen Sieg für OpenAI in den Rechtsstreitigkeiten zwischen KI und Urheberrechten und dient als Referenz für die Bearbeitung zukünftiger ähnlicher Fälle. Das Gericht wies die Klage ab und betonte, dass die umfassende Natur der Inhalte von generativen KIs die Wahrscheinlichkeit einer wörtlichen Kopie gering macht, was einen rechtlichen Rahmen und Erkenntnisse für die Bearbeitung zukünftiger Streitigkeiten zwischen KI und Urheberrechten liefert.
【AiBase Zusammenfassung:】
📜 Die Kläger konnten keinen tatsächlichen Schaden durch das Verhalten von OpenAI nachweisen, daher wies das Gericht die Klage ab.
🔍 Der Richter betonte, dass die umfassende Natur der Inhalte von generativen KIs die Wahrscheinlichkeit einer wörtlichen Kopie gering macht.
⚖️ Dieses Urteil liefert einen rechtlichen Rahmen und Erkenntnisse für die Bearbeitung zukünftiger Streitigkeiten zwischen KI und Urheberrechten.
12. Microsoft Outlook führt KI-basierte, personalisierte dynamische Themen ein, die sich je nach Wetter und Standort dynamisch aktualisieren
Die von Microsoft kürzlich eingeführte Co-Pilot-Themenfunktion bietet Outlook ein personalisiertes visuelles Erlebnis, mit dem Nutzer ein einzigartiges Aussehen erstellen können. Die KI-gestützte Themenfunktion ist nicht nur ästhetisch ansprechend, sondern aktualisiert sich auch dynamisch anhand von Wetter und Standort, um das Benutzererlebnis zu verbessern. Nutzer können ein angenehmeres und personalisierteres E-Mail-Management-Erlebnis genießen.