ZyphraAI hat kürzlich sein neuestes mehrsprachiges Text-to-Speech (TTS)-Modell Zonos-TTS veröffentlicht. Dieses Modell basiert auf der Apache2.0-Lizenz, ist vollständig Open Source und kommerziell nutzbar. Zonos-TTS unterstützt nicht nur die Echtzeit-Sprachklonierung, sondern wurde auch mit 200.000 Stunden englischer Sprachdaten trainiert und zeigt eine herausragende Leistung.
Zonos-TTS bietet zwei Bereitstellungsmethoden: lokale Bereitstellung und einen praktischen API-Dienst. Für normale Benutzer bietet ZyphraAI einen kostenlosen Service von 100 Minuten Audio pro Monat; professionelle Benutzer können ein Paket mit 300 Minuten/5 US-Dollar wählen, wobei zusätzliche Minuten mit 0,02 US-Dollar pro Minute berechnet werden.
Besonders erwähnenswert ist die Funktion der Echtzeit-Sprachklonierung, die völlig kostenlos ist und eine hohe Audioqualität und emotionale Steuerung unterstützt. Dies bietet den Benutzern große Flexibilität und Praktikabilität.
Darüber hinaus unterstützt Zonos-TTS die Eingabe von Audio-Präfixen, wodurch die Anwendungsszenarien erweitert werden. Laut Tests von ZyphraAI kann das Modell auf einer RTX4090-Grafikkarte mit etwa doppelter Echtzeitgeschwindigkeit laufen und zeigt so eine hohe Effizienz. Diese Open-Source-Veröffentlichung bietet Entwicklern und Unternehmen ein leistungsstarkes und flexibles Werkzeug zur Förderung der Entwicklung von mehrsprachiger Echtzeit-Sprachklonierungstechnologie.
Adresse: https://huggingface.co/Zyphra/Zonos-v0.1-hybrid