ultravox-v0_4_1-llama-3_1-70b
多様な音声に対応する大規模言語モデル
一般製品生産性音声認識テキスト生成
fixie-ai/ultravox-v0_4_1-llama-3_1-70bは、事前学習済みのLlama 3.1-70B-Instructとwhisper-large-v3-turboを基盤とした大規模言語モデルで、音声とテキストの入力を処理し、テキスト出力を生成します。特殊な擬似トークン<|audio|>を使用して、入力音声を埋め込みに変換し、テキストプロンプトと結合することで、テキスト出力が生成されます。Ultravoxは、音声エージェント、音声翻訳、音声分析など、音声認識とテキスト生成のアプリケーションシナリオを拡大することを目指して開発されました。このモデルはMITライセンスに従い、Fixie.aiによって開発されています。
ultravox-v0_4_1-llama-3_1-70b 最新のトラフィック状況
月間総訪問数
29742941
直帰率
44.20%
平均ページ/訪問
5.9
平均訪問時間
00:04:44