Mini-Omni
Modelo de lenguaje grande multi-modal de código abierto, compatible con entrada de voz en tiempo real y salida de audio en streaming.
Producto ComúnProductividadMultimodalReconocimiento de voz
Mini-Omni es un modelo de lenguaje grande multi-modal de código abierto que permite la capacidad de conversación con entrada de voz en tiempo real y salida de audio en streaming. Ofrece una función de conversación de voz a voz en tiempo real, sin necesidad de modelos ASR o TTS adicionales. Además, puede generar audio mientras piensa, admitiendo la generación simultánea de texto y audio. Mini-Omni mejora aún más su rendimiento mediante inferencia por lotes 'Audio-a-Texto' y 'Audio-a-Audio'.
Mini-Omni Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34