ultravox-v0_4_1-llama-3_1-70b

多様な音声に対応する大規模言語モデル

一般製品生産性音声認識テキスト生成
fixie-ai/ultravox-v0_4_1-llama-3_1-70bは、事前学習済みのLlama 3.1-70B-Instructとwhisper-large-v3-turboを基盤とした大規模言語モデルで、音声とテキストの入力を処理し、テキスト出力を生成します。特殊な擬似トークン<|audio|>を使用して、入力音声を埋め込みに変換し、テキストプロンプトと結合することで、テキスト出力が生成されます。Ultravoxは、音声エージェント、音声翻訳、音声分析など、音声認識とテキスト生成のアプリケーションシナリオを拡大することを目指して開発されました。このモデルはMITライセンスに従い、Fixie.aiによって開発されています。
ウェブサイトを開く

ultravox-v0_4_1-llama-3_1-70b 最新のトラフィック状況

月間総訪問数

29742941

直帰率

44.20%

平均ページ/訪問

5.9

平均訪問時間

00:04:44

ultravox-v0_4_1-llama-3_1-70b 訪問数の傾向

ultravox-v0_4_1-llama-3_1-70b 訪問地理的分布

ultravox-v0_4_1-llama-3_1-70b トラフィックソース

ultravox-v0_4_1-llama-3_1-70b 代替品