8月23日、Metaは公式ウェブサイトで、多言語音声翻訳の大規模言語モデルSeamlessM4Tのオープンソース化を発表しました。SeamlessM4Tは100種類の言語の音声翻訳に対応し、音声からテキスト、音声から音声、テキストから音声、テキストからテキストへの多様な翻訳を実現します。Metaが以前リリースしたNLLB、MMSなどの翻訳モデルを統合し、27万時間ものアラインメントされた音声テキストデータでトレーニングされており、現在、最大規模かつ最も機能が充実したオープンソースの翻訳モデルです。