Llasa-1B

Llasa-1B es un modelo de texto a voz (TTS) basado en LLaMA, que admite la síntesis de voz en chino e inglés.

Producto ComúnOtrosTexto a vozSíntesis de voz
Llasa-1B es un modelo de texto a voz desarrollado por el Laboratorio de Audio de la Universidad de Ciencia y Tecnología de Hong Kong. Basado en la arquitectura LLaMA, y combinando las etiquetas de voz del código XCodec2, puede convertir texto en voz natural y fluida. El modelo se entrenó con 250,000 horas de datos de voz en chino e inglés, admite la generación de voz a partir de texto plano y también puede utilizar indicaciones de voz dadas para la síntesis. Sus principales ventajas son la capacidad de generar voz multilingüe de alta calidad, adecuada para diversas situaciones de síntesis de voz, como audiolibros y asistentes de voz. Este modelo utiliza la licencia CC BY-NC-ND 4.0, por lo que se prohíbe su uso comercial.
Abrir sitio web

Llasa-1B Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

Llasa-1B Tendencia de visitas

Llasa-1B Distribución geográfica de las visitas

Llasa-1B Fuentes de tráfico

Llasa-1B Alternativas