SpeechGPT 2.0-versión preliminar

Primer sistema de interacción en tiempo real a nivel humano orientado a la inteligencia contextual, que admite la interacción de voz con múltiples emociones y estilos.

Producto ComúnChatInteracción de vozInteligencia artificial
SpeechGPT 2.0-versión preliminar es un modelo avanzado de interacción de voz desarrollado por el Laboratorio de Procesamiento del Lenguaje Natural de la Universidad de Fudan. Entrenado con una gran cantidad de datos de voz, ha logrado una capacidad de interacción de voz de baja latencia y alta naturalidad. El modelo puede simular expresiones de voz con múltiples emociones, estilos y roles, al tiempo que admite funciones como la invocación de herramientas, la búsqueda en línea y el acceso a bases de conocimientos externas. Sus principales ventajas incluyen una potente capacidad de generalización del estilo de voz, simulación de múltiples roles y una experiencia de interacción de baja latencia. Actualmente, el modelo solo admite interacción de voz en chino, y en el futuro se planea expandirse a más idiomas.
Abrir sitio web

SpeechGPT 2.0-versión preliminar Situación del tráfico más reciente

Total de visitas mensuales

747

Tasa de rebote

38.29%

Páginas promedio por visita

1.3

Duración promedio de la visita

00:00:17

SpeechGPT 2.0-versión preliminar Tendencia de visitas

SpeechGPT 2.0-versión preliminar Distribución geográfica de las visitas

SpeechGPT 2.0-versión preliminar Fuentes de tráfico

SpeechGPT 2.0-versión preliminar Alternativas