El 20 de enero de 2025, MiniMax, filial de Shanghai Xiyu Technology Co., Ltd., anunció el lanzamiento global simultáneo de su nueva generación de modelos de voz T2A-01 y el lanzamiento del producto de voz Hailuo. La serie T2A-01 incluye dos modelos: T2A-01-HD y T2A-01-Turbo, disponibles para los usuarios. Los servicios de API ya están disponibles en la plataforma abierta de MiniMax, permitiendo a las empresas elegir en función de la calidad de audio y la velocidad de generación.
MiniMax, como empresa líder en tecnología de inteligencia artificial general, se centra en el desarrollo independiente de grandes modelos multimodales, incluyendo modelos de texto MoE con billones de parámetros, modelos de voz y modelos de imagen. Basándose en estos modelos, MiniMax ha lanzado aplicaciones nativas como Xingye y Hailuo AI, y ofrece servicios de API de plataforma abierta para empresas y desarrolladores. El modelo de voz T2A-01, recién lanzado, no solo se caracteriza por su claridad de audio, ritmo natural y expresión precisa de las emociones, sino que también admite 17 idiomas, incluyendo chino, cantonés, inglés, japonés, coreano, árabe y español, así como cientos de tonos preestablecidos, ofreciendo a los usuarios empresariales e individuales una experiencia de generación de voz natural y fluida.
Uno de los puntos fuertes de Hailuo Voice es su potente capacidad de síntesis multilingüe. Con el apoyo del modelo T2A-01, Hailuo Voice supera a productos similares en pruebas de similitud, tasa de error y percepción auditiva. En varios idiomas como chino, cantonés, inglés, japonés, coreano y árabe, Hailuo Voice presenta una similitud y precisión significativamente superiores, con una capacidad general comparable a la del modelo líder mundial ElevenLabs. Además, Hailuo Voice cuenta con capacidad de comprensión emocional, pudiendo identificar e imitar las sutiles diferencias emocionales en el habla. Los usuarios pueden especificar la emoción según sus necesidades, generando una salida de voz que captura con precisión las emociones humanas profundas.
Hailuo Voice también ofrece a los usuarios una amplia selección de tonos y funciones de personalización. Los usuarios pueden filtrar por idioma, acento, sexo y edad, seleccionando entre más de 300 tonos preestablecidos y ajustando finamente el tono mediante ecualizadores, como ajustar la claridad, la intensidad, añadir eco, radio, distorsión, efectos electrónicos, etc., para satisfacer las necesidades de diferentes escenarios.
Hailuo Voice (Versión China):
https://hailuoai.com/audio
Hailuo Audio (Versión Internacional):
https://hailuo.ai/audio
Servicio de API en China:
https://platform.minimaxi.com/document/T2A%20V2
Servicio de API Internacional:
https://intl.minimaxi.com/document/T2A%20V2?key=66719005a427f0c8a5701643