ZyphraAIは最近、最新の多言語テキスト読み上げ(TTS)モデルであるZonos-TTSを発表しました。このモデルはApache2.0ライセンスに基づいており、完全にオープンソースで商用利用が可能です。Zonos-TTSはリアルタイムの音声クローン機能をサポートするだけでなく、20万時間の英語音声データでトレーニングされており、優れた性能を発揮します。

Zonos-TTSは、ローカルでの展開と便利なAPIサービスの2つの展開方法を提供しています。一般ユーザー向けには、ZyphraAIが毎月100分の音声生成を無料で提供します。プロフェッショナルユーザーは、300分/5ドルのプランを選択でき、超過分は1分あたり0.02ドルで課金されます。

特に注目すべきは、リアルタイムの音声クローン機能が完全に無料で、高音質と感情制御に対応しているため、ユーザーに大きな柔軟性と実用性を提供している点です。

さらに、Zonos-TTSは音声プレフィックス入力をサポートしており、適用範囲をさらに広げています。ZyphraAIのテストによると、RTX4090グラフィックカードでは、このモデルは約2倍のリアルタイム速度で動作し、非常に高い効率性を示しています。今回のオープンソース化により、開発者と企業は強力で柔軟なツールを得て、多言語リアルタイム音声クローン技術の発展に貢献できます。

アドレス:https://huggingface.co/Zyphra/Zonos-v0.1-hybrid