SpeechGPT

Modelo de lenguaje multimodal

Producto ComúnProgramaciónVozMultimodal
SpeechGPT es un modelo de lenguaje multimodal con capacidad inherente de diálogo multi-modal. Puede percibir y generar contenido multimodal, siguiendo instrucciones humanas multimodales. SpeechGPT-Gen es un modelo de generación de voz que amplía la cadena de información. SpeechAgents es una simulación de comunicación humana con un sistema multi-modal y multi-agente. SpeechTokenizer es un tokenizador de voz unificado para modelos de lenguaje de voz. La fecha de lanzamiento y la información relacionada de estos modelos y conjuntos de datos se pueden encontrar en el sitio web oficial.
Abrir sitio web

SpeechGPT Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

SpeechGPT Tendencia de visitas

SpeechGPT Distribución geográfica de las visitas

SpeechGPT Fuentes de tráfico

SpeechGPT Alternativas