O Meta lançou um modelo de tradução de IA chamado SeamlessM4T, que suporta tradução de voz para texto, texto para texto e texto para voz em quase 100 idiomas. A capacidade de reconhecimento de voz do SeamlessM4T atingiu o nível humano, e sua capacidade de lidar com ruídos de fundo e variações de voz também melhorou significativamente. O Meta não apenas lançou o modelo SeamlessM4T gratuitamente sob uma licença de pesquisa, mas também tornou público o conjunto de dados de treinamento chave do modelo, o SeamlessAlign. Este é o maior conjunto de dados público até agora usado para tradução multimodal. O lançamento do SeamlessM4T é considerado um grande passo em direção a um mundo sem barreiras linguísticas. Embora o modelo ainda apresente alguns vieses e erros, o Meta planeja realizar pesquisas e melhorias adicionais com base no SeamlessM4T.