O Meta lançou um modelo de tradução de IA chamado SeamlessM4T, que suporta tradução de voz para texto, texto para texto e texto para voz em quase 100 idiomas. A capacidade de reconhecimento de voz do SeamlessM4T atingiu o nível humano, e sua capacidade de lidar com ruídos de fundo e variações de voz também melhorou significativamente. O Meta não apenas lançou o modelo SeamlessM4T gratuitamente sob uma licença de pesquisa, mas também tornou público o conjunto de dados de treinamento chave do modelo, o SeamlessAlign. Este é o maior conjunto de dados público até agora usado para tradução multimodal. O lançamento do SeamlessM4T é considerado um grande passo em direção a um mundo sem barreiras linguísticas. Embora o modelo ainda apresente alguns vieses e erros, o Meta planeja realizar pesquisas e melhorias adicionais com base no SeamlessM4T.
Tradução direta em 100 idiomas! Meta lança o novo modelo SeamlessM4T, e o conjunto de dados principal também é de código aberto

36氪
Este artigo é do AIbase Daily
Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.