Meta ha lanzado un modelo de traducción de IA llamado SeamlessM4T, que admite la traducción de voz a texto, texto a texto y texto a voz en casi 100 idiomas. La capacidad de reconocimiento de voz de SeamlessM4T ha alcanzado un nivel humano, y también ha mejorado significativamente su capacidad para manejar el ruido de fondo y las variaciones en la voz. Meta no solo ha abierto el código fuente del modelo SeamlessM4T gratuitamente bajo una licencia de investigación, sino que también ha hecho público el conjunto de datos clave de entrenamiento del modelo, SeamlessAlign. Este es, hasta la fecha, el conjunto de datos público más grande utilizado para la traducción multimodal. El lanzamiento de SeamlessM4T se considera un gran paso hacia un mundo sin barreras lingüísticas. Si bien el modelo aún presenta algunos sesgos y errores, Meta planea realizar más investigaciones y mejoras en SeamlessM4T.