SpeechGPT 2.0-versión preliminar
Primer sistema de interacción en tiempo real a nivel humano orientado a la inteligencia contextual, que admite la interacción de voz con múltiples emociones y estilos.
Producto ComúnChatInteracción de vozInteligencia artificial
SpeechGPT 2.0-versión preliminar es un modelo avanzado de interacción de voz desarrollado por el Laboratorio de Procesamiento del Lenguaje Natural de la Universidad de Fudan. Entrenado con una gran cantidad de datos de voz, ha logrado una capacidad de interacción de voz de baja latencia y alta naturalidad. El modelo puede simular expresiones de voz con múltiples emociones, estilos y roles, al tiempo que admite funciones como la invocación de herramientas, la búsqueda en línea y el acceso a bases de conocimientos externas. Sus principales ventajas incluyen una potente capacidad de generalización del estilo de voz, simulación de múltiples roles y una experiencia de interacción de baja latencia. Actualmente, el modelo solo admite interacción de voz en chino, y en el futuro se planea expandirse a más idiomas.
SpeechGPT 2.0-versión preliminar Situación del tráfico más reciente
Total de visitas mensuales
747
Tasa de rebote
38.29%
Páginas promedio por visita
1.3
Duración promedio de la visita
00:00:17