OpenAI ha añadido una API de texto a voz a su Playground para desarrolladores, lo que facilita el trabajo de los desarrolladores. Simplemente introduciendo un mensaje de texto, se puede generar audio seleccionando entre seis voces preestablecidas.
Lo más inteligente es que esta API identifica automáticamente el idioma del texto y lo empareja con la voz correspondiente, eliminando la necesidad de seleccionar el idioma y la versión del país.
Este servicio no solo simplifica el proceso de desarrollo, sino que también proporciona tecnología de síntesis de voz de alta calidad. La función de texto a voz de OpenAI puede convertir texto escrito en audio hablado que suena muy natural, ofreciendo infinitas posibilidades para crear experiencias de usuario inmersivas e interactivas.
Las voces de texto a voz de OpenAI incluyen dos variantes de modelo para satisfacer las necesidades de diferentes escenarios:
Neural: Esta variante de modelo está optimizada para casos de uso en tiempo real que requieren la menor latencia posible. Aunque la calidad puede ser ligeramente inferior a NeuralHD, es la opción ideal para aplicaciones que requieren una respuesta rápida.
NeuralHD: Como su nombre indica, esta variante de modelo se centra en proporcionar la salida de voz de la más alta calidad. Si su aplicación busca la mejor calidad de audio, NeuralHD es sin duda la mejor opción.
En resumen, la API de texto a voz de OpenAI ofrece a los desarrolladores una herramienta potente y flexible que satisface sus necesidades, tanto en comunicación en tiempo real como en la producción de contenido de alta calidad. Este avance demuestra una vez más el enorme potencial de la tecnología de IA para mejorar y optimizar la experiencia diaria de las personas en el trabajo y en su vida personal.
Dirección para probar online: https://platform.openai.com/playground/tts