ElevenLabs Scribe

Scribeは、99言語に対応する世界で最も正確な音声テキスト変換モデルです。

編集者のおすすめ生産性音声認識多言語対応
Scribeは、ElevenLabsが開発した高精度な音声テキスト変換モデルであり、現実世界のオーディオの予測不可能性に対処することを目的としています。99言語に対応し、単語レベルのタイムスタンプ、話者分離、オーディオイベントのマーキングなどの機能を提供します。Scribeは、FLEURSとCommon Voiceのベンチマークテストで卓越したパフォーマンスを示し、Gemini 2.0 Flash、Whisper Large V3、Deepgram Nova-3などのトップモデルを上回っています。従来のサービスが不十分な言語(セルビア語、広東語、マラヤーラム語など)におけるエラー率を大幅に削減しており、これらの言語は競合モデルではエラー率が40%を超えることが一般的です。Scribeは開発者向けにAPIインターフェースを提供しており、リアルタイムアプリケーションに対応する低遅延バージョンも近日中にリリース予定です。
ウェブサイトを開く

ElevenLabs Scribe 最新のトラフィック状況

月間総訪問数

16245987

直帰率

38.53%

平均ページ/訪問

5.2

平均訪問時間

00:05:51

ElevenLabs Scribe 訪問数の傾向

ElevenLabs Scribe 訪問地理的分布

ElevenLabs Scribe トラフィックソース

ElevenLabs Scribe 代替品