Emilia é um conjunto de dados de voz em campo aberto de código aberto e multilíngue, projetado especificamente para pesquisa em geração de voz em larga escala. Ele contém mais de 101.000 horas de dados de voz de alta qualidade em seis idiomas e suas respectivas transcrições de texto, cobrindo diversos estilos de fala e tipos de conteúdo, como programas de entrevistas, debates, comentários esportivos e audiolivros.