Mini-Omni

Modelo de lenguaje grande multi-modal de código abierto, compatible con entrada de voz en tiempo real y salida de audio en streaming.

Producto ComúnProductividadMultimodalReconocimiento de voz
Mini-Omni es un modelo de lenguaje grande multi-modal de código abierto que permite la capacidad de conversación con entrada de voz en tiempo real y salida de audio en streaming. Ofrece una función de conversación de voz a voz en tiempo real, sin necesidad de modelos ASR o TTS adicionales. Además, puede generar audio mientras piensa, admitiendo la generación simultánea de texto y audio. Mini-Omni mejora aún más su rendimiento mediante inferencia por lotes 'Audio-a-Texto' y 'Audio-a-Audio'.
Abrir sitio web

Mini-Omni Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

Mini-Omni Tendencia de visitas

Mini-Omni Distribución geográfica de las visitas

Mini-Omni Fuentes de tráfico

Mini-Omni Alternativas