Am 20. Januar 2025 veröffentlichte die Doubao App ihr neuestes „End-to-End“-Sprachmodell und führte wichtige Updates für die Echtzeit-Sprachfunktion ein. Dieser Fortschritt markiert einen weiteren Sprung für Doubao im Bereich der Sprachinteraktion. Es geht über die vorherige Kaskade von ASR (automatische Spracherkennung), LLM (großes Sprachmodell) und TTS (Text-zu-Sprache) hinaus und integriert Spracherkennung, -verständnis und -erzeugung in einem einzigen Modell.
Getestet von „Intelligente Emergenz“, liegt der größte Vorteil der neuen Doubao-Version in ihrer menschenähnlichen Ausdrucksfähigkeit und emotionalen Ausgabe, was die Gesprächsflüssigkeit und Intelligenz verbessert. Besonders die Modi „Seelen-Sänger“ und „Vielseitiger Star“ ermöglichen es Doubao nicht nur zu singen, sondern auch vielfältige Rollenspiele zu spielen und so zum neuen Liebling der Benutzer zu werden. Wenn der Benutzer beispielsweise Doubao bittet, die Stimme des Stars Yu Shuxin nachzuahmen, kopiert Doubao nicht nur den Tonfall der Figur, sondern drückt auch auf charmante Weise seine eigene Persönlichkeit aus.
Besonders erwähnenswert ist, dass Doubao im natürlichen Gespräch spontan Lieder komponieren kann, ohne komplexe Anweisungen oder professionelle Hinweise zu benötigen. Benutzer können Doubao einfach bitten zu singen und sogar ein Thema für den Liedtext angeben. Obwohl Doubao gelegentlich kleine Fehler macht, sind seine Reaktionsgeschwindigkeit und seine Fähigkeit zur Improvisation erstaunlich und zeigen seine starke menschenähnliche Fähigkeit.
Zusätzlich bieten die neu hinzugefügten Persönlichkeitsmodi „Gekränktes kleines Paket“ und „Lob-Meister“ den Benutzern ein frisches Erlebnis. Diese Persönlichkeitsmodi ermöglichen es Doubao, in verschiedenen Situationen unterschiedliche Emotionen und Stile zu zeigen, wodurch die Interaktion interessanter und realistischer wird.
In Zeiten der rasanten Entwicklung der Sprachinteraktionstechnologie erweitert Doubao mit diesem Update nicht nur die Anwendungsszenarien von KI auf Bereiche wie emotionale Begleitung und psychologische Beratung, sondern bringt auch die emotionale Kommunikationsfähigkeit von KI dem Menschen näher. Diese Veränderung wird Doubao zweifellos einen Platz im hart umkämpften Markt sichern und die zukünftige Entwicklung der KI-Interaktion vorantreiben.