Llasa-1B
Llasa-1B es un modelo de texto a voz (TTS) basado en LLaMA, que admite la síntesis de voz en chino e inglés.
Producto ComúnOtrosTexto a vozSíntesis de voz
Llasa-1B es un modelo de texto a voz desarrollado por el Laboratorio de Audio de la Universidad de Ciencia y Tecnología de Hong Kong. Basado en la arquitectura LLaMA, y combinando las etiquetas de voz del código XCodec2, puede convertir texto en voz natural y fluida. El modelo se entrenó con 250,000 horas de datos de voz en chino e inglés, admite la generación de voz a partir de texto plano y también puede utilizar indicaciones de voz dadas para la síntesis. Sus principales ventajas son la capacidad de generar voz multilingüe de alta calidad, adecuada para diversas situaciones de síntesis de voz, como audiolibros y asistentes de voz. Este modelo utiliza la licencia CC BY-NC-ND 4.0, por lo que se prohíbe su uso comercial.
Llasa-1B Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44