Qwen2-Audio
アリババクラウドが発表した大規模音声言語モデル
プレミアム新製品オープンソース音声処理言語モデル
Qwen2-Audioは、アリババクラウドが開発した大規模音声言語モデルです。様々な音声信号を入力として受け入れ、音声指示に基づいて音声分析を行うか、または直接テキストで応答します。音声チャットと音声分析という2種類の異なる音声インタラクションモードをサポートしています。自動音声認識(ASR)、音声テキスト変換(S2TT)、音声感情認識(SER)など、13個の標準ベンチマークテストで優れた性能を示しています。
Qwen2-Audio 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34