Metaは、SeamlessM4TというAI翻訳モデルを発表しました。これは、約100種類の言語に対応する音声テキスト変換、テキストテキスト変換、テキスト音声変換をサポートしています。SeamlessM4Tの音声認識能力は人間レベルに達しており、背景音や音声変化への対応も大幅に向上しています。Metaは、SeamlessM4Tモデルを研究ライセンスの下で無料でオープンソース化しただけでなく、モデルの主要なトレーニングデータセットであるSeamlessAlignも公開しました。これは、マルチモーダル翻訳に使用される公開データセットとしてはこれまで最大規模のものです。SeamlessM4Tの発表は、言語の壁のない世界への大きな一歩と見なされています。モデルにはまだいくつかの偏見や誤差が残っていますが、MetaはSeamlessM4Tを基に更なる研究と改良を行う予定です。