El 20 de enero de 2025, la aplicación Doubao lanzó oficialmente su último modelo de lenguaje de voz "de extremo a extremo" y realizó una importante actualización de su función de llamadas de voz en tiempo real. Este avance marca un nuevo salto en el campo de la interacción de voz para Doubao, superando las soluciones en cascada anteriores de ASR (reconocimiento automático de voz), LLM (modelo de lenguaje grande) y TTS (texto a voz), integrando el reconocimiento, la comprensión y la generación de voz en un solo modelo.
Tras las pruebas de 《Inteligencia Emergente》, el punto culminante de la nueva versión de Doubao radica en su capacidad de expresión y salida emocional similar a la humana, mejorando la fluidez e inteligencia del diálogo. Especialmente los modos "Cantante con Alma" y "Gran Variedad", permiten a Doubao no solo cantar, sino también realizar interpretaciones de roles ricas, convirtiéndose en el nuevo favorito de la interacción con el usuario. Por ejemplo, cuando un usuario le pide a Doubao que imite la voz de la estrella Yu Shuxin, Doubao no solo reproduce con éxito el tono de la personalidad, sino que también expresa su personalidad única de forma traviesa.
Más notable aún, Doubao puede crear canciones improvisadas en conversaciones naturales, sin necesidad de instrucciones complejas o indicaciones profesionales. Los usuarios pueden pedirle a Doubao que cante libremente, incluso especificando el tema de la letra. Si bien el rendimiento de Doubao ocasionalmente tiene pequeños errores, su velocidad de respuesta y capacidad de creación improvisada son asombrosas, mostrando su poderosa capacidad de personificación.
Además, los nuevos modos de personalidad "Doubao Resentido" y "Maestro de los Elogios" añaden frescura a la experiencia del usuario. Estos modos de personalidad permiten que Doubao muestre diferentes emociones y estilos en diferentes contextos, mejorando así la diversión y el realismo de la interacción.
En la actualidad, con el desarrollo continuo de la tecnología de interacción de voz, esta actualización de Doubao no solo amplía las aplicaciones de la IA a campos como el acompañamiento emocional y la asesoría psicológica, sino que también acerca la capacidad de comunicación emocional de la IA a la de los humanos. Este cambio sin duda permitirá a Doubao ocupar un lugar destacado en el competitivo mercado y liderar el futuro desarrollo de la interacción con la IA.