Parler-TTS
高品質で自然な音声の生成
プレミアム新製品生産性TTS音声生成
Parler-TTSは、Hugging Faceが開発した軽量のテキスト音声変換(TTS)モデルです。指定された話者のスタイル(性別、トーン、話し方など)で、高品質で自然な音声の生成が可能です。Stability AIとエディンバラ大学のDan Lyth氏とSimon King氏による論文『Natural language guidance of high-fidelity text-to-speech with synthetic annotations』に基づいて再現されており、データセット、前処理、トレーニングコード、ウェイトを含め、完全にオープンソースで公開されています。他のTTSモデルとは異なり、Parler-TTSはデータセット、前処理、トレーニングコード、そしてウェイトを含め全てがオープンソースで公開されています。機能としては、高品質で自然な音声出力の生成、柔軟な使用と展開、豊富な注釈付き音声データセットの提供などが挙げられます。価格:無料
Parler-TTS 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34