Moonshine
高速かつ高精度なエッジデバイス向け自動音声認識モデル
一般製品生産性自動音声認識エッジコンピューティング
Moonshineは、リソースの限られたデバイス向けに最適化された音声テキスト変換モデルシリーズです。リアルタイムでのオンデバイスアプリケーション(現場での転写や音声コマンド認識など)に最適です。HuggingFaceが管理するOpenASRランキングで使用されているテストデータセットにおいて、Moonshineの単語誤り率(WER)は、同規模のOpenAI Whisperモデルを上回っています。さらに、Moonshineの計算需要は入力音声の長さに応じて変化するため、短い入力音声はより高速に処理されます。これは、すべての音声を30秒のブロックとして処理するWhisperモデルとは異なります。Moonshineは、10秒の音声断片をWhisperの5倍の速度で処理しながら、同等かそれ以上のWERを維持します。
Moonshine 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34