Llasa-1B

Llasa-1B est un modèle de synthèse vocale (TTS) basé sur LLaMA, prenant en charge la synthèse vocale en chinois et en anglais.

Produit OrdinaireAutreTexte-à-paroleSynthèse vocale
Llasa-1B est un modèle de synthèse vocale développé par le laboratoire audio de l'Université de Science et Technologie de Hong Kong. Basé sur l'architecture LLaMA et intégrant les marqueurs vocaux du codebook XCodec2, il convertit le texte en parole naturelle et fluide. Entraîné sur 250 000 heures de données vocales en chinois et en anglais, ce modèle permet de générer de la parole à partir de texte brut ou d'utiliser des invites vocales pour une synthèse plus précise. Ses principaux avantages sont la génération de parole multilingue de haute qualité, adaptée à divers contextes tels que les livres audio et les assistants vocaux. Ce modèle est sous licence CC BY-NC-ND 4.0 et son utilisation commerciale est interdite.
Ouvrir le site Web

Llasa-1B Dernière situation du trafic

Nombre total de visites mensuelles

29742941

Taux de rebond

44.20%

Nombre moyen de pages par visite

5.9

Durée moyenne de la visite

00:04:44

Llasa-1B Tendance des visites

Llasa-1B Distribution géographique des visites

Llasa-1B Sources de trafic

Llasa-1B Alternatives