KI-Tagesbericht: Step-Video, ein großes Sprachmodell von JumpStar; Immediate Dream AI-Bildmodell 2.1 unterstützt die Textgenerierung; Tencent veröffentlicht das große Video-Generierungsmodell Hun Yuan

Willkommen beim AI-Daily-Bereich! Hier finden Sie Ihren täglichen Leitfaden zur Erkundung der Welt der künstlichen Intelligenz. Täglich präsentieren wir Ihnen die wichtigsten Themen aus dem Bereich KI, mit Fokus auf Entwickler, um Ihnen zu helfen, Technologietrends zu erkennen und innovative KI-Produktanwendungen kennenzulernen.

Neue KI-Produkte hier entdecken: https://top.aibase.com/

1. Das Step-Video-Modell von Jieyue Xingchen startet die interne Testphase – Antrag über Yuewen Video möglich

Das Step-Video-Modell von Jieyue Xingchen hat offiziell die interne Testphase begonnen. Benutzer können sich über die Website von Yuewen Video für die Teilnahme bewerben. Das Modell kann aus Text Videos mit einer Auflösung von bis zu 1080P und einer maximalen Länge von 10 Sekunden generieren. Es zeigt bemerkenswerte Vorteile in der automatischen Optimierung von Prompts, im ästhetischen Stil und in der Bewegungssteuerung.

【AiBase Zusammenfassung:】
🎬 Das Step-Video-Modell generiert hochauflösende Videos aus Text, mit einer Auflösung von bis zu 1080P und einer maximalen Länge von 10 Sekunden.
🌟 Step-Video versteht und generiert chinesische Stile besonders präzise und entspricht der Stimmung alter Gedichte.
⚙️ Das Modell zeigt eine hervorragende Leistung in der Bewegungssteuerung, generiert Videos, die den physikalischen Gesetzen entsprechen und komplexe räumliche Beziehungen verarbeitet.
Detaillierte Informationen: https://top.aibase.com/tool/yuewenshipin

2. Luma veröffentlicht das neue Bildgenerierungsmodell Luma Photon – schneller und kostengünstiger!

Luma Labs hat Luma Photon und Photon Flash vorgestellt, zwei revolutionäre Bildgenerierungsmodelle mit extrem hoher Geschwindigkeit und niedrigen Kosten. Luma Photon hat in mehreren Tests hervorragende Ergebnisse erzielt und kann qualitativ hochwertige Bilder generieren, die für Werbung, Film, Kunst und viele andere Bereiche geeignet sind.

【AiBase Zusammenfassung:】
🚀 Luma Photon generiert Bilder 10-mal schneller als andere Modelle auf dem Markt und kostet nur 0,2 Cent pro 1080p-Bild.
🎨 Es unterstützt mehrstufige Anweisungen in natürlicher Sprache, sodass Benutzer die generierten Inhalte schrittweise optimieren können. Ideal für komplexe kreative Aufgaben.
📈 In Bezug auf Qualität, Kreativität und Verständnis übertrifft Luma Photon in Blindtests alle anderen Modelle auf dem Markt.
Detaillierte Informationen: https://lumalabs.ai/photon

3. Die Werke des Keling AI-Regie-Kooperationsprojekts werden am 6. Dezember veröffentlicht – 9 Filme im AI-Stil

Kuaishou Technology kündigte an, am 6. Dezember das erste AIGC-Regie-Kooperationsprojekt Chinas – das „Keling AI-Regie-Kooperationsprojekt“ – offiziell zu starten. Dieses Projekt wurde gemeinsam von dem von Kuaishou selbst entwickelten Videogenerierungsmodell „Keling AI“ und mehreren bekannten Regisseuren ins Leben gerufen, um mit Hilfe von KI-Technologie die Grenzen der Filmgestaltung zu erweitern.

【AiBase Zusammenfassung:】
🎥 Das Projekt wurde gemeinsam von Kuaishou Technology und 9 bekannten Regisseuren ins Leben gerufen und umfasst verschiedene Themen.
🤖 Alle Kurzfilme werden mit Keling AI generiert, um den Einsatz von KI-Technologie in der Filmgestaltung voranzutreiben.
📈 Seit seiner Veröffentlichung hat Keling AI über 5 Millionen Nutzer bedient und 51 Millionen Videos und 150 Millionen Bilder generiert.

4. Bildmodell 2.1 von Jiemeng AI (ByteDance) in der Grauen Testphase – KI-Bilderzeugung unterstützt jetzt chinesische Schriftzeichen!

Jiemeng AI von ByteDance hat kürzlich das Bildmodell 2.1 veröffentlicht, das das Problem der chinesischen Schriftzeichen in der KI-Bilderzeugung löst. Benutzer können einfach eine Textbeschreibung eingeben, um schnell personalisierte Poster zu generieren, was die Effizienz von Designern erheblich steigert. Das neue Modell ist vielseitig einsetzbar, z. B. für die Erstellung von Postern, Buchumschlägen und Social-Media-Bildern.

【AiBase Zusammenfassung:】
🎨 Das neue Modell unterstützt die Generierung chinesischer Schriftzeichen und verbessert die Effizienz der Postergestaltung.
📚 Benutzer können mit Textbeschreibungen personalisierte Poster und Cover erstellen.
🌌 Das Modell ist vielseitig einsetzbar und eignet sich für Social Media, Storytelling usw.
Detaillierte Informationen: https://top.aibase.com/tool/jimeng

5. Mita AI-Suche: „Wissenschaftliche Suche“ mit 7-fach erhöhter Datenmenge und neuer „Erklärungs“-Funktion

Die Shanghai Mita Network Technology Co., Ltd. hat kürzlich ihr Mita AI-Wissenschaftssuchfunktion erheblich verbessert. Die Datenmenge wurde um das 7-fache erhöht, sodass Benutzer jetzt umfassender auf Millionen von Open-Access-Artikeln zugreifen können, darunter 40 % der SCI-Artikel und Top-Zeitschriften wie „Nature“ und „Science“. Das Update enthält auch eine neue „Erklärungs“-Funktion, die Benutzern hilft, komplexe Inhalte zu verstehen.

微信截图_20241203091022.png

【AiBase Zusammenfassung:】
📈 Die Datenmenge wurde um das 7-fache erhöht, mit Zugriff auf Millionen von Open-Access-Artikeln, was die Suchfunktion verbessert.
📝 Die neue „Erklärungs“-Funktion hilft Benutzern, komplexe Sätze in Artikeln zu verstehen.
🌍 Es wird ein Übersetzungsmodell für 44 Sprachen unterstützt, wodurch die Leseschwierigkeiten von Artikeln in weniger verbreiteten Sprachen beseitigt werden.

6. Li Feifeis erstes Startup: Ein Bild generiert eine interaktive 3D-Welt – AIGC betritt eine neue Ära!

Li Feifeis neuestes Startup-Projekt, World Labs, präsentiert eine bahnbrechende 3D-Generierungstechnologie. Benutzer können mit nur einem Bild oder einem Satz interaktive 3D-Szenen erstellen, was die AIGC-Technologie in eine neue immersive Ära führt. Diese Technologie kann nicht nur Details präzise wiedergeben, sondern auch verschiedene Kameraeffekte simulieren und den Benutzern eine regieähnliche Kontrolle ermöglichen.

【AiBase Zusammenfassung:】
🖼️ Mit nur einem Bild oder einem Satz können lebensechte 3D-Szenen generiert werden, die ein völlig neues interaktives Erlebnis ermöglichen.
🎥 Die Technologie unterstützt die Simulation verschiedener Kameraeffekte, sodass Benutzer die Kamera in der 3D-Welt frei steuern können.
🚀 World Labs plant, die Größe und Genauigkeit der 3D-Welten weiter zu verbessern und weitere interaktive Möglichkeiten für Benutzer zu erforschen.
Detaillierte Informationen: https://www.worldlabs.ai/blog

7. Schluss mit Sprachklon-Urheberrechtsverletzungen! Hume AI präsentiert Sprachsteuerungsfunktion zur Erstellung personalisierter KI-Stimmen

Hume AI hat kürzlich eine experimentelle Funktion namens „Sprachsteuerung“ vorgestellt, mit der Benutzer ganz einfach personalisierte KI-Stimmen erstellen können, ohne Programmierkenntnisse zu benötigen. Mit dieser Funktion können Benutzer die Stimmeigenschaften über Schieberegler anpassen und bieten verschiedene Anpassungsmöglichkeiten, um die vielfältigen Anwendungsanforderungen zu erfüllen.

【AiBase Zusammenfassung:】
🔊 Hume AI präsentiert die „Sprachsteuerungs“-Funktion, mit der Benutzer einfach personalisierte KI-Stimmen erstellen können.
🛠️ Diese Funktion erfordert keine Programmierkenntnisse. Benutzer können die Stimmeigenschaften über Schieberegler anpassen.
🌐 Hume zielt darauf ab, die vielfältigen Anwendungsanforderungen durch personalisierte und emotional intelligente Sprach-KI zu erfüllen.
Detaillierte Informationen: https://www.hume.ai/blog/introducing-voice-control

8. Cohere präsentiert das neue Suchmodell Rerank3.5: Präzise Abfragen in über 100 Sprachen

Das kürzlich von Cohere vorgestellte Suchmodell Rerank3.5 stellt einen großen Fortschritt in der Unternehmenssuchtechnologie dar. Das Modell unterstützt Abfragen in über 100 Sprachen, insbesondere in wichtigen Handelssprachen wie Arabisch, Japanisch und Koreanisch, und hilft multinationalen Unternehmen, Sprachbarrieren zu überwinden. Interne Tests zeigen eine deutliche Verbesserung der Leistung von Rerank3.5 im Finanzdienstleistungsbereich, mit Kosteneinsparungen und Risikominderung.

【AiBase Zusammenfassung:】
📊 Rerank3.5 kann Abfragen in über 100 Sprachen verarbeiten und hilft globalen Unternehmen, Sprachbarrieren zu überwinden.
💡 Interne Tests zeigen eine deutliche Verbesserung der Suchleistung im Finanzdienstleistungsbereich, mit Kosteneinsparungen und Risikominderung.
🚀 Cohere strebt durch die Bereitstellung über gängige Cloud-Plattformen danach, der Branchenstandard für die Unternehmenssuche zu werden. Unternehmen müssen sich gleichzeitig an das sich schnell verändernde KI-Umfeld anpassen.
Detaillierte Informationen: https://cohere.com/blog/rerank-3pt5

9. OpenAI-CFO antwortet auf Gerüchte über Werbung: Derzeit keine Pläne für ein Werbemodell

OpenAIs Finanzchefin Sarah Friar erklärte in einem Interview, dass das Unternehmen derzeit keine Pläne für die Einführung von Werbung habe, obwohl Werbeeinnahmen für profitable Unternehmen eine attraktive Option darstellen. Friar erwähnte, dass OpenAI schnell wächst und Möglichkeiten im bestehenden Geschäftsmodell sieht. Zukünftig könnten andere Einnahmequellen geprüft werden.

【AiBase Zusammenfassung:】
🌟 OpenAI-CFO Sarah Friar erklärte, dass derzeit keine Absicht besteht, Werbung einzuführen, aber zukünftig andere Einnahmequellen geprüft werden könnten.
💼 OpenAI hat mehrere Experten aus den Bereichen Werbung und Marketing eingestellt, was darauf hindeutet, dass zukünftig ein Werbemodell in Betracht gezogen werden könnte.
🚪 Häufiger Wechsel im Management, Gründer Sam Altman treibt die Vision des Unternehmens weiter voran.

10. ChatGPT stürzt bei Erwähnung von „David Mayer“ ab – welche geheimnisvolle Kraft steckt dahinter?

Kürzlich tauchte in den sozialen Medien ein verwirrendes Phänomen auf: Der OpenAI-Chatbot ChatGPT kann nicht normal auf die Erwähnung von „David Mayer“ reagieren und bricht den Dialog zwangsweise ab. Dieses Phänomen hat zu breiten Diskussionen und Spekulationen unter den Nutzern geführt. Viele haben versucht, ChatGPT nach Informationen über „David Mayer“ zu fragen, aber alle mit dem gleichen Ergebnis.

【AiBase Zusammenfassung:】
🌐 ChatGPT kann bei Erwähnung von „David Mayer“ nicht reagieren und bricht den Dialog zwangsweise ab.
🔍 „David Mayer“ könnte mit rechtlichen Problemen im Zusammenhang mit dem Recht auf Vergessenwerden (GDPR) in Verbindung stehen.
🤔 Auch andere Namen können zu Fehlfunktionen von ChatGPT führen, was die Komplexität von KI-Modellen verdeutlicht.

11. WPS Office präsentiert KI-Sprachnotizfunktion

WPS Office hat kürzlich die KI-Sprachnotizfunktion veröffentlicht, die die Sprach-zu-Text-Erfahrung verbessert und Echtzeitaufnahmen und mehrsprachige Übersetzung unterstützt. Diese Funktion verbessert die Genauigkeit durch Spracherkennung und KI-automatische Zusammenfassung und ist tief in WPS Cloud Documents integriert, um einen reibungslosen Aufnahmeprozess zu gewährleisten. Benutzer finden und verwenden diese Funktion ganz einfach in der neuesten Version von WPS Office.

微信截图_20241203150637.png

【AiBase Zusammenfassung:】
🗣️ Die Sprachnotizfunktion ermöglicht Echtzeitaufnahmen und die Umwandlung von Audio in Text.
🌐 Unterstützt die Übersetzung zwischen Chinesisch, Englisch und anderen Sprachen.
🔒 Bietet eine sichere Dokumenten-Zusammenarbeitserfahrung und verbessert die Benutzerfreundlichkeit.

12. Tencent veröffentlicht das Hunyuan-Videogenerierungsmodell: 130 Millionen Parameter, vollständig Open Source

Tencent hat das Hunyuan-Videogenerierungsmodell mit 130 Millionen Parametern veröffentlicht, das derzeit größte Open-Source-Videogenerierungsmodell. Das Modell unterstützt die Generierung von hochauflösenden, realistischen Videos und eignet sich für kommerzielle Anwendungen wie Werbung und kreative Videos. Benutzer können es über die Tencent Yuanbao-App und die Tencent Cloud-Schnittstelle testen oder anbinden, wodurch die technischen Hürden für die Videogenerierung gesenkt und die Verbreitung der KI-Technologie gefördert werden.

【AiBase Zusammenfassung:】

KI-Nachrichten

KI-Tagesübersicht

KI-Zeitleiste

Al hardware

Neueste Fälle

Bildersammlung

Videosammlung

Audiosammlung

Inhaltssammlung

Neueste Tutorials

KI-Produkt-Ranking

KI-Traffic-Wachstumsranking

KI-Traffic-Rückgangsranking

KI-Wochenranking

Vereinigte Staaten

China

Indien

Brasilien

Bildgenerierung

Persönlicher Assistent

Charaktergenerierung

Videogenerierung

KI-Projektranking

KI-Projektwachstumsranking

KI-Entwickler-Ranking

KI-Organisationsranking

Deepseek

TTS

LLM

ChatGPT

Überblick

KI-Tagesbericht: Step-Video, ein großes Sprachmodell von JumpStar; Immediate Dream AI-Bildmodell 2.1 unterstützt die Textgenerierung; Tencent veröffentlicht das große Video-Generierungsmodell Hun Yuan

站长之家

Dieser Artikel stammt aus dem AIbase-Tagesbericht