Llasa-1B

Llasa-1B ist ein auf LLaMA basierendes Text-to-Speech (TTS)-Modell, das die Sprachsynthese in Mandarin und Englisch unterstützt.

Normales ProduktAndereText-to-SpeechSprachsynthese
Llasa-1B ist ein von der Audiolabor der Hong Kong University of Science and Technology entwickeltes Text-to-Speech-Modell. Es basiert auf der LLaMA-Architektur und kann durch die Kombination von Sprachmarkierungen aus dem XCodec2-Codebook Text in natürliche und flüssige Sprache umwandeln. Das Modell wurde mit 250.000 Stunden Mandarin- und Englisch-Sprachdaten trainiert und unterstützt die Sprachgenerierung aus reinem Text sowie die Synthese mit gegebenen Sprachanweisungen. Seine Hauptvorteile liegen in der Generierung hochwertiger mehrsprachiger Sprache, die für verschiedene Sprachsynthese-Szenarien geeignet ist, wie z. B. Hörbücher und Sprachassistenten. Das Modell verwendet die CC BY-NC-ND 4.0 Lizenz und ist für kommerzielle Zwecke nicht gestattet.
Website öffnen

Llasa-1B Neueste Verkehrssituation

Monatliche Gesamtbesuche

29742941

Absprungrate

44.20%

Durchschnittliche Seiten pro Besuch

5.9

Durchschnittliche Besuchsdauer

00:04:44

Llasa-1B Besuchstrend

Llasa-1B Geografische Verteilung der Besuche

Llasa-1B Traffic-Quellen

Llasa-1B Alternativen