Llasa-1B
Llasa-1B ist ein auf LLaMA basierendes Text-to-Speech (TTS)-Modell, das die Sprachsynthese in Mandarin und Englisch unterstützt.
Normales ProduktAndereText-to-SpeechSprachsynthese
Llasa-1B ist ein von der Audiolabor der Hong Kong University of Science and Technology entwickeltes Text-to-Speech-Modell. Es basiert auf der LLaMA-Architektur und kann durch die Kombination von Sprachmarkierungen aus dem XCodec2-Codebook Text in natürliche und flüssige Sprache umwandeln. Das Modell wurde mit 250.000 Stunden Mandarin- und Englisch-Sprachdaten trainiert und unterstützt die Sprachgenerierung aus reinem Text sowie die Synthese mit gegebenen Sprachanweisungen. Seine Hauptvorteile liegen in der Generierung hochwertiger mehrsprachiger Sprache, die für verschiedene Sprachsynthese-Szenarien geeignet ist, wie z. B. Hörbücher und Sprachassistenten. Das Modell verwendet die CC BY-NC-ND 4.0 Lizenz und ist für kommerzielle Zwecke nicht gestattet.
Llasa-1B Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44