Scribe es un modelo de voz a texto de alta precisión desarrollado por ElevenLabs, diseñado para gestionar la imprevisibilidad del audio del mundo real. Es compatible con 99 idiomas y ofrece funciones como marcas de tiempo a nivel de palabra, separación de hablantes y etiquetado de eventos de audio. Scribe ha demostrado un rendimiento excelente en las pruebas de referencia FLEURS y Common Voice, superando a modelos líderes como Gemini 2.0 Flash, Whisper Large V3 y Deepgram Nova-3. Reduce significativamente la tasa de error en idiomas tradicionalmente insuficientemente atendidos (como el serbio, el cantonés y el malayalam), donde los modelos de la competencia suelen tener tasas de error superiores al 40%. Scribe ofrece una interfaz de API para la integración de desarrolladores y se lanzará una versión de baja latencia para admitir aplicaciones en tiempo real.