Seed-ASR
大規模言語モデルをベースとした音声認識技術。
プレミアム新製品その他音声認識大規模言語モデル
Seed-ASRは、バイトダンス社が開発した大規模言語モデル(Large Language Model, LLM)に基づく音声認識モデルです。連続音声表現とコンテキスト情報をLLMに入力することで、LLMの能力を活用し、大規模な訓練とコンテキスト認識能力によって、複数領域、アクセント/方言、言語を含む包括的な評価セットでのパフォーマンスを大幅に向上させました。最近発表された大規模ASRモデルと比較して、Seed-ASRは中国語と英語の共通テストセットで10~40%の単語誤り率の低減を実現し、その強力な性能をさらに証明しています。
Seed-ASR 最新のトラフィック状況
月間総訪問数
16826
直帰率
42.75%
平均ページ/訪問
2.8
平均訪問時間
00:02:20