Em 20 de janeiro de 2025, a MiniMax, subsidiária da Shanghai Xiyu Technology Co., Ltd., anunciou o lançamento global de sua nova série de modelos de voz T2A-01, atualizada, e lançou o produto de voz Hailuo. A série T2A-01 inclui dois modelos: T2A-01-HD e T2A-01-Turbo, disponíveis para os usuários. Os serviços de API foram lançados simultaneamente na plataforma aberta MiniMax, permitindo que as empresas escolham com base na qualidade de áudio e na velocidade de geração.

A MiniMax, como empresa líder em tecnologia de inteligência artificial geral, concentra-se no desenvolvimento independente de grandes modelos multimodais, incluindo modelos de texto MoE com trilhões de parâmetros, modelos de voz e modelos de imagem. Com base nesses modelos, a MiniMax lançou aplicativos nativos como Xingye e Hailuo AI, e fornece serviços de API de plataforma aberta para empresas e desenvolvedores. O modelo de voz da série T2A-01 lançado desta vez não apenas possui características como som nítido, ritmo natural e expressão emocional precisa, mas também suporta 17 idiomas, incluindo chinês, cantonês, inglês, japonês, coreano, árabe e espanhol, e mais de 100 timbres predefinidos, proporcionando aos usuários corporativos e individuais uma experiência de geração de voz natural e fluida.

微信截图_20250120115029.png

Um dos destaques do Hailuo Voice é sua poderosa capacidade de síntese multilíngue. Com o suporte do modelo T2A-01, o Hailuo Voice lidera produtos similares em avaliações de similaridade, taxa de erro e experiência auditiva. Em vários idiomas, incluindo chinês, cantonês, inglês, japonês, coreano e árabe, a similaridade e a precisão do Hailuo Voice são significativamente superiores, e sua capacidade abrangente é comparável à do modelo líder internacional ElevenLabs. Além disso, o Hailuo Voice possui capacidade de compreensão emocional, podendo identificar e reproduzir inteligentemente as sutis diferenças emocionais na voz. Os usuários podem especificar as emoções conforme necessário para gerar uma saída de voz que capture precisamente as emoções profundas dos seres humanos.

O Hailuo Voice também oferece aos usuários uma ampla gama de opções de timbre e recursos de ajuste personalizado. Os usuários podem filtrar por idioma, sotaque, sexo e idade e selecionar o timbre adequado entre mais de 300 timbres predefinidos. Eles também podem ajustar finamente o timbre usando equalizadores, como ajustar a clareza e a intensidade do timbre, e adicionar efeitos especiais como eco, transmissão, distorção e som eletrônico para atender às necessidades de diferentes cenários.

Hailuo Voice (versão chinesa):

https://hailuoai.com/audio

Hailuo Audio (versão internacional):

https://hailuo.ai/audio

Serviço de API doméstico:

https://platform.minimaxi.com/document/T2A%20V2

Serviço de API internacional:

https://intl.minimaxi.com/document/T2A%20V2?key=66719005a427f0c8a5701643