Metaは、最大100言語の音声とテキストの翻訳をサポートする、SeamlessM4Tという多様なモードを持つ人工知能モデルを発表しました。
このモデルは、音声認識、音声テキスト翻訳、音声音声翻訳、テキストテキスト翻訳、テキスト音声翻訳といった機能を実行できます。
SeamlessM4Tは、複数のモデルを連結したものではなく、単一の人工知能モデルです。そのため、エラーが減り、翻訳効率が向上しています。
Metaの研究者たちは、自動的に整列された47万時間以上の音声翻訳データを含む、SeamlessAlignという多様なモードのコーパスを作成しました。これは、将来の人工知能翻訳モデルのトレーニングに使用できます。