2025年1月20日、上海稀宇科技有限公司傘下のMiniMaxは、新たにアップグレードされたT2A-01シリーズ音声モデルを世界同時リリースし、海螺音声製品を発表しました。T2A-01シリーズには、T2A-01-HDとT2A-01-Turboの2つのモデルがあり、APIサービスはMiniMaxオープンプラットフォームで同時に開始されました。企業は、音声品質と生成速度のニーズに合わせてモデルを選択できます。
MiniMaxは、数千億パラメーターのMoEテキスト大規模モデル、音声大規模モデル、画像大規模モデルなど、様々なモダリティの汎用大規模モデルの独自開発に注力する、先進的な汎用人工知能テクノロジー企業です。これらのモデルに基づき、MiniMaxは星野、海螺AIなどのネイティブアプリケーションをリリースし、企業や開発者向けにオープンなプラットフォームAPIサービスを提供しています。今回発表されたT2A-01シリーズ音声モデルは、クリアな音質、自然なリズム、正確な感情表現を特徴とするだけでなく、中国語、広東語、英語、日本語、韓国語、アラビア語、スペイン語など17言語と、100種類以上のプリセットボイスに対応し、企業や個人ユーザーに自然でスムーズな音声生成体験を提供します。
海螺音声の最大の特長は、強力な多言語合成能力です。T2A-01モデルのサポートにより、海螺音声は類似度、エラー率、聴感評価において同類製品を上回っています。中国語、広東語、英語、日本語、韓国語、アラビア語など複数の言語において、海螺音声の類似度と正確性は大幅に優れており、総合的な能力は国際的なトップモデルであるElevenLabsに匹敵します。さらに、海螺音声は感情理解能力も備えており、音声の微妙な感情の違いをインテリジェントに認識して再現します。ユーザーは必要に応じて感情を指定し、人間の深層感情を正確に捉えた音声出力を生成できます。
海螺音声は、豊富なボイスセレクションとパーソナライズされた調整機能も提供しています。ユーザーは、言語、アクセント、性別、年齢で分類して検索し、300種類以上のプリセットボイスから適切なボイスを選択できます。また、エフェクターを使用して、ボイスの透明度や音量を微調整したり、エコー、放送、歪み、エレクトロニックミュージックなどの特殊効果を追加したりすることで、様々なシーンのニーズに対応できます。
海螺音声:
https://hailuoai.com/audio
Hailuo Audio(海外版):
https://hailuo.ai/audio
国内APIサービス:
https://platform.minimaxi.com/document/T2A%20V2
海外APIサービス:
https://intl.minimaxi.com/document/T2A%20V2?key=66719005a427f0c8a5701643