Willkommen beim AI-Tagesbericht! Hier finden Sie täglich einen Überblick über die Welt der Künstlichen Intelligenz. Wir präsentieren Ihnen täglich die wichtigsten Neuigkeiten aus dem KI-Bereich, mit Fokus auf Entwickler, um Ihnen zu helfen, Technologietrends zu verstehen und innovative KI-Produktanwendungen kennenzulernen.

Neue KI-Produkte hier entdecken: https://top.aibase.com/

1. OpenAI präsentiert neues Sprachtranskriptionsmodell gpt-4o-transcribe – deutlich höhere Genauigkeit bei der Sprach-zu-Text-Umwandlung

OpenAI hat kürzlich drei neue Sprachmodelle vorgestellt: gpt-4o-transcribe, gpt-4o-mini-transcribe und gpt-4o-mini-tts. Besonders gpt-4o-transcribe hat viel Aufmerksamkeit erregt. Das Modell überzeugt im Bereich der Sprachtranskription mit einer deutlich reduzierten Fehlerquote, insbesondere bei der englischen Transkription mit nur 2,46%. Darüber hinaus unterstützt gpt-4o-transcribe die Transkription in komplexen Umgebungen und verfügt über Technologien zur Geräuschunterdrückung und semantischen Sprachaktivitätserkennung.

image.png

【AiBase Zusammenfassung:】

🔊 Die Fehlerquote von gpt-4o-transcribe liegt bei der englischen Transkription bei nur 2,46% und ist damit deutlich besser als beim Vorgängermodell Whisper.

🌍 Unterstützt über 100 Sprachen und bietet hohe Genauigkeit selbst in lauten Umgebungen und bei verschiedenen Akzenten.

💻 Entwickler können das neue Modell einfach über eine API integrieren und so die Entwicklung von Sprachinteraktionsanwendungen vorantreiben.

Detaillierte Informationen: https://top.aibase.com/tool/openai-fm

2. Kuaishou-Suche mit KI-Upgrade: DeepSeek R1 vollständig integriert – ein Quantensprung für die Sucherfahrung!

Kuaishou hat kürzlich die vollständige Integration des großen Sprachmodells DeepSeek R1 in seine Suchfunktion angekündigt. Ziel ist es, die Suchergebnisse und die Benutzererfahrung deutlich zu verbessern und die Benutzeraktivität zu steigern. Gleichzeitig erforscht Kuaishou das kommerzielle Potenzial intelligenter Suchfunktionen. Durch die Integration von DeepSeek wird die KI-gestützte Content-Erstellungsplattform „Keling AI“ bei der Erstellung von Videos und Bildern effizienter. Benutzer können den Erstellungsprozess präziser steuern und die kreativen Möglichkeiten erweitern.

image.png

【AiBase Zusammenfassung:】

🚀 Die Suchfunktion von Kuaishou ist jetzt vollständig mit dem DeepSeek R1-Sprachmodell integriert, was zu besseren Suchergebnissen und einer verbesserten Benutzererfahrung führt.

💡 Die KI-Content-Erstellungsplattform „Keling AI“ ist nun mit DeepSeek integriert, sodass Benutzer effizienter Inhalte erstellen und optimieren können.

🎥 Die DeepSeek-Inspirationsversion ist eng mit dem „Inspirationswörterbuch“ von Kuaishou verknüpft, sodass Benutzer die wichtigsten Elemente ihrer Kreationen präzise steuern können.

3. Claude erhält Websuche-Funktion – liefert aktuelle Informationen mit Quellenangaben

Anthropic integriert eine Websuchfunktion in seinen KI-Assistenten Claude, um aktuellere Informationen bereitzustellen. Im Gegensatz zu herkömmlichen Suchmaschinen wandelt Claude die Suchergebnisse in dialogbasierte Antworten um und gibt die Quellen präzise an. Diese Funktion ist derzeit nur für zahlende Nutzer in den USA verfügbar und soll später auch in anderen Ländern und für kostenlose Accounts angeboten werden.

image.png

【AiBase Zusammenfassung:】

🌐 Claude wandelt Online-Suchergebnisse in dialogbasierte Antworten um und gibt die Quellen an.

💰 Die Websuchfunktion ist derzeit nur für zahlende Nutzer in den USA verfügbar und soll später erweitert werden.

⚖️ Der durch Suchroboter verursachte Traffic-Rückgang stellt eine Herausforderung für websites dar, die auf den Traffic angewiesen sind.

4. ByteDance präsentiert Bildgenerierungs-Framework InfiniteYou: Gesichtsmerkmale bleiben erhalten, Szenen beliebig austauschbar

ByteDance hat mit InfiniteYou (InfU) ein innovatives Tool zur Bildgenerierung vorgestellt, das auf Basis von Textbeschreibungen hochwertige, personalisierte Bilder erstellt. Die Kerntechnologie InfuseNet sorgt durch eine präzise Trainingsstrategie dafür, dass die generierten Bilder die Identität des Nutzers beibehalten, während Szenen und Inhalte flexibel verändert werden können.

image.png

【AiBase Zusammenfassung:】

🧑‍🚀 InfiniteYou ist ein von ByteDance entwickeltes Bildgenerierungsmodell, das personalisierte Bilder auf Basis von Textbeschreibungen erstellt.

🔧 Die Kerntechnologie InfuseNet sorgt durch präzises Training dafür, dass die generierten Bilder die Identität des Nutzers beibehalten und gleichzeitig die Szenen flexibel verändert werden können.

🌐 Das Tool ist mit verschiedenen bestehenden Tools kompatibel, eignet sich für die akademische Forschung und muss den entsprechenden Lizenzen und gesetzlichen Bestimmungen entsprechen.

Detaillierte Informationen: https://top.aibase.com/tool/infiniteyou

5. Tencent Yuanbao-Funktion erweitert: Analyse komplexer Excel-Tabellen jetzt möglich

Die neue Funktion von Tencent Yuanbao erleichtert die Bearbeitung von Excel-Tabellen erheblich. Benutzer können einfach Fragen in natürlicher Sprache stellen, und Yuanbao liest die Daten schnell aus, führt Berechnungen durch und hebt wichtige Informationen hervor. Komplizierte Vorgänge werden vereinfacht, sodass auch Excel-Anfänger Datenanalysen problemlos durchführen können.

image.png

【AiBase Zusammenfassung:】

📝 Die neue Funktion ermöglicht es Benutzern, Fragen in natürlicher Sprache zu stellen und so den Prozess der Excel-Datenanalyse zu vereinfachen.

⚡ Das Hun Yuan Turbo S-Modell verarbeitet komplexe Tabellen schnell und erhöht die Analyseeffizienz.

📱 Die Funktion ist plattformübergreifend verfügbar, sodass Benutzer Tabellen jederzeit und überall hochladen und analysieren können.

6. Krea AI veröffentlicht „Video Training“-Funktion: Eigene Videostile trainieren

Krea AI hat kürzlich die neue „Video Training“-Funktion vorgestellt, mit der Benutzer durch das Hochladen eigener Bilder und Videos ein individuelles KI-Videostylmodell trainieren können. Diese Funktion basiert auf dem Wan2.1-Modell und ermöglicht es Benutzern, spezifische Kunststile und dynamische Bewegungen zu erlernen, wodurch die Personalisierung und Flexibilität der Inhaltserstellung deutlich verbessert wird. Benutzer können mehrere Parameter nach Bedarf anpassen, und die generierten Stilmodelle können direkt auf der Krea Video-Plattform verwendet werden.

image.png

【AiBase Zusammenfassung:】

📹 Benutzer können Bilder und Videos hochladen, um ein individuelles KI-Videostylmodell zu trainieren.

⚙️ Bietet eine flexible Benutzererfahrung, bei der Benutzer Trainingsparameter anpassen können, um die Modellleistung zu optimieren.

🌟 Diese Funktion eröffnet neue Möglichkeiten für Content-Ersteller und steigert die Effizienz der Erstellung.

Detaillierte Informationen: https://www.krea.ai/train

7. DomoAI präsentiert Sprach-Bild-Generierungsfunktion für digitale Avatare: Neue Durchbrüche in der digitalen Content-Erstellung

Die neue Funktion von DomoAI ermöglicht es Benutzern, sprechende digitale Avatare durch das Hochladen von Sprache und Bildern zu erstellen, was zu intensiven Diskussionen geführt hat und einen wichtigen Fortschritt in der digitalen Content-Erstellung darstellt. Die Funktion unterstützt nicht nur die Lippensynchronisation, sondern kann auch kurze Videos unterschiedlicher Länge erstellen. Besonders die Unterstützung der chinesischen Sprache ist hervorzuheben, was die Flexibilität und Effizienz der Erstellung deutlich erhöht.

image.png

【AiBase Zusammenfassung:】

🎤 Benutzer können durch das Hochladen von Sprache und Bildern schnell sprechende virtuelle Charaktere erstellen und dabei aus verschiedenen Längen wählen.

🚀 Die Funktion ist schnell, bietet hervorragende Unterstützung für die chinesische Sprache und erfüllt die Anforderungen verschiedener Szenarien.

🎨 Die innovative Technologie von DomoAI senkt die Einstiegshürde für die Content-Erstellung und fördert die enge Verzahnung von KI und Unterhaltungsindustrie.

Detaillierte Informationen: https://www.domoai.app/en/create/talking-avatar

8. Sider AI präsentiert Deep Research-Funktion: Simuliert menschliches Forschungsverhalten und generiert interaktive Berichte

Die kürzlich von Sider AI vorgestellte Deep Research-Funktion hat viel Aufmerksamkeit erregt, da sie menschliches Forschungsverhalten simulieren und automatisiert visualisierte Berichte erstellen kann. Durch Echtzeitnotizen und transparente Informationsquellen wird die Forschungseffizienz gesteigert und gleichzeitig die Kontrolle des Benutzers erhöht.

image.png

【AiBase Zusammenfassung:】

🤖 Die Deep Research-Funktion simuliert menschliches Forschungsverhalten, greift automatisch auf Online-Informationen zu und erstellt Echtzeitnotizen.

📊 Nach dem Sammeln von Informationen erstellt die Funktion automatisch interaktive, visualisierte Webseiten mit Diagrammen, Flussdiagrammen usw.

🔍 Benutzer können die Automatisierung und manuelle Forschung nahtlos über Browsererweiterungen integrieren, geeignet für verschiedene Forschungsszenarien.

Detaillierte Informationen: https://sider.ai/wisebase/deep-research

9. Gymnasiast entwickelt mit Minecraft eine Website zur Bewertung von KI-Modellen – gemeinschaftliche Beurteilung der Modellqualität

Mit der rasanten Entwicklung der KI-Technologie stellt die Bewertung und der Vergleich von generativen KI-Modellen eine große Herausforderung dar. Die Website MC-Bench bietet mit dem Spiel Minecraft eine neuartige Bewertungsmethode. Benutzer können ohne Wissen über die Details für die von der KI erstellten Gebäude abstimmen. Diese Idee erhöht nicht nur die öffentliche Beteiligung, sondern bietet auch eine intuitive visuelle Erfahrung für die Bewertung von KI-Modellen.

image.png

【AiBase Zusammenfassung:】

🎮 MC-Bench nutzt Minecraft als Bewertungsplattform, auf der Benutzer durch Abstimmung die Leistung von KI-Modellen bewerten.

👨‍🎓 Das Projekt wurde von einem Gymnasiasten ins Leben gerufen und wird von mehreren führenden KI-Unternehmen unterstützt, was die Innovationskraft junger Menschen zeigt.

🛠️ Zukünftig könnte MC-Bench auf komplexere KI-Aufgaben erweitert werden und so ein effektives Werkzeug zum Testen der KI-Inferenzfähigkeit darstellen.

Detaillierte Informationen: https://top.aibase.com/tool/mc-bench

10. Von ehemaligen Google-Wissenschaftlern entwickelt! Reka veröffentlicht Reka Flash 3 – leistungsstärker als Gemma 3 27B

Reka AI hat kürzlich sein erstes Open-Source-Modell Reka Flash 3 vorgestellt, ein universelles Inferenzmodell mit 210 Millionen Parametern, das in der Branche große Aufmerksamkeit erregt hat. Obwohl die Parameterzahl geringer ist als bei einigen Mitbewerbern, zeichnet es sich durch seine Entwicklung von Grund auf und seine tiefgreifende Optimierung aus, was zu einer hervorragenden Leistung führt. Reka Flash3 bietet nicht nur leistungsstarke Inferenzfunktionen, sondern unterstützt auch eine latenzarme und gerätefreundliche Bereitstellung, die für verschiedene Endgeräte geeignet ist.

image.png

【AiBase Zusammenfassung:】

🚀 Reka Flash3 ist ein Open-Source-Modell von Reka AI, das von ehemaligen Google DeepMind-Wissenschaftlern entwickelt wurde. Es verfügt über 210 Millionen Parameter und übertrifft viele große Modelle in seiner Leistung.

💡 Das Modell verfügt über leistungsstarke Inferenzfunktionen, unterstützt die Beantwortung komplexer Fragen und mehrstufige Schlussfolgerungen und eignet sich für verschiedene innovative Anwendungsfälle.

📱 Reka Flash3 ist latenzarm und gerätefreundlich, und es ist möglich, dass es in Zukunft auf Smartphones und anderen Endgeräten direkt zur Verfügung stehen wird.

Detaillierte Informationen: https://top.aibase.com/tool/reka-flash-3

11. Shengshu Technology Vidu erhält Lizenzen zur Adaption von 7 Webnovel-IPs mit Millionen von Lesern für Konzept-Kurzfilme

Die AI-Videoproduktionsplattform Vidu der Pekinger Shengshu Technology Co., Ltd. hat kürzlich Lizenzen zur Adaption von 7 Webnovel-IPs mit Millionen von Lesern für Konzept-Kurzfilme erhalten, was einen weiteren Meilenstein für den chinesischen Markt für Anime-Kurzfilme darstellt. Diese Werke decken verschiedene Genres ab, darunter Fantasy, Science-Fiction, Kampfkünste und urbane Romantik, und verfügen über eine breite Fangemeinde und ein starkes Potenzial für die Verfilmung.

image.png

【AiBase Zusammenfassung:】

🎬 Vidu erhält Lizenzen zur Adaption von 7 Webnovel-IPs mit Millionen von Lesern für Konzept-Kurzfilme, die verschiedene Genres abdecken.

⚙️ KI-Technologie automatisiert die Erstellung von Drehbüchern und Videobildern und erhöht die Produktionseffizienz erheblich.

⏱️ Die Produktionszeit verkürzt sich von mehreren Monaten auf wenige Wochen oder sogar Tage, wodurch die hohen Kosten traditioneller Adaptionen reduziert werden.

12. Weltweit erstes pädiatrisches großes Sprachmodell vorgestellt – unterstützt die Verbesserung der Kindergesundheitsversorgung