Llasa-1B
Llasa-1B est un modèle de synthèse vocale (TTS) basé sur LLaMA, prenant en charge la synthèse vocale en chinois et en anglais.
Produit OrdinaireAutreTexte-à-paroleSynthèse vocale
Llasa-1B est un modèle de synthèse vocale développé par le laboratoire audio de l'Université de Science et Technologie de Hong Kong. Basé sur l'architecture LLaMA et intégrant les marqueurs vocaux du codebook XCodec2, il convertit le texte en parole naturelle et fluide. Entraîné sur 250 000 heures de données vocales en chinois et en anglais, ce modèle permet de générer de la parole à partir de texte brut ou d'utiliser des invites vocales pour une synthèse plus précise. Ses principaux avantages sont la génération de parole multilingue de haute qualité, adaptée à divers contextes tels que les livres audio et les assistants vocaux. Ce modèle est sous licence CC BY-NC-ND 4.0 et son utilisation commerciale est interdite.
Llasa-1B Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44