Flash é o modelo de conversão de texto em fala (Text-to-Speech, TTS) mais recente da ElevenLabs. Ele gera voz em 75 milissegundos, incluindo a latência do aplicativo e da rede, sendo a escolha ideal para agentes de voz conversacionais de baixa latência. O Flash v2 suporta apenas inglês, enquanto o Flash v2.5 suporta 32 idiomas, com custo de 1 crédito para cada dois caracteres. Em testes cegos, o Flash superou consistentemente modelos concorrentes de latência ultrabaixa, sendo o modelo mais rápido com garantia de qualidade.