Meta发布了一款名为SeamlessM4T的AI翻译模型,它支持近100种语言的语音转文本、文本转文本以及文本转语音翻译。SeamlessM4T的语音识别能力已经达到人类水准,处理背景音和变化语音的能力也有很大提高。Meta不仅以研究许可证的形式免费开源了SeamlessM4T模型,还公开了模型的关键训练数据集SeamlessAlign。这是迄今为止用于多模式翻译的最大的公开数据集。SeamlessM4T的发布被认为是向没有语言障碍的世界迈进了一大步。虽然模型仍存在一些偏见和误差,但Meta计划在SeamlessM4T的基础上进行进一步的研究和改进。