SeamlessM4T
多モーダルモデルに基づく音声翻訳製品で、約100言語の自動音声認識、音声翻訳、テキスト翻訳、音声合成などをサポートしています。
一般製品生産性音声翻訳テキスト翻訳
SeamlessM4Tは、多モーダルモデルに基づく音声翻訳製品であり、約100言語の自動音声認識、音声翻訳、テキスト翻訳、音声合成などをサポートしています。本製品は、新たな多タスクUnitYモデルアーキテクチャを採用し、翻訳テキストと音声の直接生成を実現しています。SeamlessM4Tの自己教師あり音声エンコーダーw2v-BERT 2.0は、数百万時間にも及ぶ多言語音声の分析を通じて、音声における構造と意味の理解を学習しています。また、SONAR、SpeechLASERなどの多言語音声・テキストデータセットや、fairseq2などのシーケンスモデリングツールキットも提供しています。SeamlessM4Tの公開は、AI技術による音声翻訳における大きな進歩を示しています。
SeamlessM4T 最新のトラフィック状況
月間総訪問数
1186988
直帰率
67.37%
平均ページ/訪問
1.6
平均訪問時間
00:01:20