Am 20. Januar 2025 gab MiniMax, ein Unternehmen der Shanghai Xiyu Technology Co., Ltd., die weltweite Einführung seiner neu aktualisierten Sprachmodelle der T2A-01-Serie und die Markteinführung des Hailuo-Sprachprodukts bekannt. Die T2A-01-Serie umfasst die beiden Modelle T2A-01-HD und T2A-01-Turbo, die Benutzern zur Verfügung stehen. Die API-Dienste wurden gleichzeitig auf der MiniMax-Open-Plattform bereitgestellt. Unternehmen können je nach Bedarf an Audioqualität und Generierungsgeschwindigkeit auswählen.

MiniMax ist ein führendes Unternehmen für allgemeine KI-Technologie, das sich auf die eigenständige Entwicklung von multimodalen, universellen großen Sprachmodellen konzentriert, darunter ein Text-Großmodell mit Billionen von Parametern (MoE), ein Sprach-Großmodell und ein Bild-Großmodell. Basierend auf diesen Modellen hat MiniMax native Anwendungen wie Xingye und Hailuo AI auf den Markt gebracht und bietet Unternehmen und Entwicklern API-Dienste über eine offene Plattform an. Die jetzt veröffentlichten Sprachmodelle der T2A-01-Serie zeichnen sich nicht nur durch klare Klangqualität, natürliche Rhythmik und präzise Emotionsausdrücke aus, sondern unterstützen auch 17 Sprachen, darunter Chinesisch, Kantonesisch, Englisch, Japanisch, Koreanisch, Arabisch und Spanisch, sowie über hundert voreingestellte Stimmen. Dies bietet Unternehmen und privaten Nutzern ein natürlich fließendes Spracherzeugungserlebnis.

微信截图_20250120115029.png

Ein Highlight von Hailuo Sprache ist die leistungsstarke mehrsprachige Synthesefähigkeit. Unterstützt durch das T2A-01-Modell übertrifft Hailuo Sprache vergleichbare Produkte in Bezug auf Ähnlichkeit, Fehlerquote und Hörerlebnis. In mehreren Sprachen wie Chinesisch, Kantonesisch, Englisch, Japanisch, Koreanisch und Arabisch liegt Hailuo Sprache in Bezug auf Ähnlichkeit und Genauigkeit deutlich vorn und erreicht eine vergleichbare Gesamtperformance wie das internationale Spitzenmodell ElevenLabs. Darüber hinaus verfügt Hailuo Sprache über die Fähigkeit zum Emotionsverständnis und kann subtile emotionale Unterschiede in der Sprache intelligent erkennen und reproduzieren. Benutzer können nach Bedarf Emotionen angeben und eine Sprachausgabe erzeugen, die menschliche Emotionen präzise erfasst.

Hailuo Sprache bietet Benutzern außerdem eine große Auswahl an Stimmen und personalisierbare Anpassungsfunktionen. Benutzer können nach Sprache, Akzent, Geschlecht und Alter filtern und aus über 300 voreingestellten Stimmen die passende auswählen. Mittels Equalizer können die Stimmen feinabgestimmt werden, z.B. die Klarheit und Lautstärke angepasst oder Effekte wie Echo, Rundfunk, Verzerrung und elektronische Musik hinzugefügt werden, um den Anforderungen verschiedener Szenarien gerecht zu werden.

Hailuo Sprache:

https://hailuoai.com/audio

Hailuo Audio (internationale Version):

https://hailuo.ai/audio

API-Dienst (China):

https://platform.minimaxi.com/document/T2A%20V2

API-Dienst (international):

https://intl.minimaxi.com/document/T2A%20V2?key=66719005a427f0c8a5701643