OuteTTS-0.2-500M
高性能テキスト音声合成モデル
一般製品音楽テキスト音声変換音声合成
OuteTTS-0.2-500MはQwen-2.5-0.5Bを基盤としたテキスト音声合成モデルであり、より大規模なデータセットで訓練されたことで、正確性、自然さ、語彙数、音声クローン機能、多言語対応において顕著な向上を実現しました。本モデルの訓練はHugging FaceによるGPU支援のおかげで実現しました。
OuteTTS-0.2-500M 最新のトラフィック状況
月間総訪問数
29742941
直帰率
44.20%
平均ページ/訪問
5.9
平均訪問時間
00:04:44