MiniMaxの海螺音声、世界同時リリース　T2A-01-Turboモデルなど含む

AIbase基地

公開日AIニュース · 1 分で読めます · Jan 20, 2025

372

2025年1月20日、上海稀宇科技有限公司傘下のMiniMaxは、新たにアップグレードされたT2A-01シリーズ音声モデルを世界同時リリースし、海螺音声製品を発表しました。T2A-01シリーズには、T2A-01-HDとT2A-01-Turboの2つのモデルがあり、APIサービスはMiniMaxオープンプラットフォームで同時に開始されました。企業は、音声品質と生成速度のニーズに合わせてモデルを選択できます。

MiniMaxは、数千億パラメーターのMoEテキスト大規模モデル、音声大規模モデル、画像大規模モデルなど、様々なモダリティの汎用大規模モデルの独自開発に注力する、先進的な汎用人工知能テクノロジー企業です。これらのモデルに基づき、MiniMaxは星野、海螺AIなどのネイティブアプリケーションをリリースし、企業や開発者向けにオープンなプラットフォームAPIサービスを提供しています。今回発表されたT2A-01シリーズ音声モデルは、クリアな音質、自然なリズム、正確な感情表現を特徴とするだけでなく、中国語、広東語、英語、日本語、韓国語、アラビア語、スペイン語など17言語と、100種類以上のプリセットボイスに対応し、企業や個人ユーザーに自然でスムーズな音声生成体験を提供します。

微信截图_20250120115029.png

海螺音声の最大の特長は、強力な多言語合成能力です。T2A-01モデルのサポートにより、海螺音声は類似度、エラー率、聴感評価において同類製品を上回っています。中国語、広東語、英語、日本語、韓国語、アラビア語など複数の言語において、海螺音声の類似度と正確性は大幅に優れており、総合的な能力は国際的なトップモデルであるElevenLabsに匹敵します。さらに、海螺音声は感情理解能力も備えており、音声の微妙な感情の違いをインテリジェントに認識して再現します。ユーザーは必要に応じて感情を指定し、人間の深層感情を正確に捉えた音声出力を生成できます。

海螺音声は、豊富なボイスセレクションとパーソナライズされた調整機能も提供しています。ユーザーは、言語、アクセント、性別、年齢で分類して検索し、300種類以上のプリセットボイスから適切なボイスを選択できます。また、エフェクターを使用して、ボイスの透明度や音量を微調整したり、エコー、放送、歪み、エレクトロニックミュージックなどの特殊効果を追加したりすることで、様々なシーンのニーズに対応できます。

海螺音声:

https://hailuoai.com/audio

Hailuo Audio（海外版）:

https://hailuo.ai/audio

国内APIサービス:

https://platform.minimaxi.com/document/T2A%20V2

海外APIサービス:

https://intl.minimaxi.com/document/T2A%20V2?key=66719005a427f0c8a5701643

MiniMax T2A-01 海螺音声汎用大規模言語モデル

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

海螺、画像人物参照機能リリース　一枚の画像から多角的な動的ポーズのキャラクター画像生成が可能に

MiniMax傘下のHailuo AIは、AI画像生成分野に画期的なイノベーションをもたらすHailuo Imageの新たな機能「Character Reference」を正式にリリースしました。AIbaseが確認したところによると、この機能では、ユーザーは一枚の参照画像に基づいて、多角的な視点、動的なポーズ、豊かな表情を持つキャラクター画像を生成できます。映画のような光と影、構図をサポートし、包括的なプロンプト制御を提供します。コミュニティはこの機能のリリースに熱狂的な反応を示しており、プロジェクトの詳細はHailuoの公式ウェブサイトで公開されています。

Apr 23, 2025

国家スパコンインターネットプラットフォーム、国産AI大規模モデルMiniMaxを公開　AIオープンソースエコシステムとインテリジェントなインタラクションの新たな発展を促進

中国の人工知能産業は、世界舞台への進出を加速させています。AIbaseがソーシャルメディアから入手した情報によると、国家スパコンインターネットプラットフォームは、MiniMax稀宇科技の国産AI大規模モデル（MiniMax-Text-01とMiniMax-VL-01を含む）を正式に公開し、スパコンインターネットAIオープンソースコミュニティに参加しました。同時に、MiniMaxのChatBot会話サービスもプラットフォームに接続され、ユーザーに効率的なインテリジェントなインタラクション体験を提供しています。以下は、AIbaseによるこの重要な進展に関する詳細な分析です。

Apr 16, 2025

国家スパコンプラットフォーム、次世代マルチモーダル大規模言語モデルを発表 AI知能体の発展を促進

Apr 16, 2025

MiniMax MCPサーバー正式稼働多モーダルAIの新時代へ

人工知能技術の限界は常に押し広げられています。AIbaseはソーシャルメディアから、中国のAIスタートアップ企業であるMiniMax稀宇科技がMiniMax MCPサーバーを正式に稼働開始したことを知りました。このサーバーは、簡単なテキスト入力だけで、ビデオ生成、画像生成、音声生成、音声クローンなどの多様な機能を呼び出すことができ、様々な主要なMCPクライアントと互換性があります。開発者やクリエイターに強力な多モーダルAIツールを提供します。以下は、AIbaseによるこの重要な発表に関する詳細な分析です。

Apr 15, 2025

MiniMax MCPサーバー正式稼働　テキスト入力でAI機能を呼び出し可能に

本日、MiniMax稀宇科技は、MiniMax MCPサーバーの正式稼働を発表しました。この革新的なプラットフォームは、ユーザーにワンストップのマルチモーダルソリューションを提供します。シンプルなテキスト入力だけで、動画生成、画像生成、音声生成、音声クローンなど、最先端のAI機能を呼び出すことができ、クリエイティブなコンテンツ生成におけるAIの応用範囲を大幅に拡大します。

Apr 14, 2025

AIデイリーニュース：アリババの通義千問がグローバルオープンソースモデルランキングで首位を獲得；MiniMaxがSpeech-02音声モデルを発表；ChatGPTの有料ユーザーが2000万人に急増

【AIデイリーニュース】へようこそ！AIの世界を探求するための毎日のガイドです。毎日、AI分野のホットなトピックを紹介し、開発者に焦点を当て、テクノロジーのトレンドを把握し、革新的なAI製品の応用を理解するお手伝いをします。最新のAI製品はこちらをご覧ください：https://top.aibase.com/1、アリババの通義千問Qwen2.5-Omniがグローバルオープンソースモデルランキングで首位を獲得2024年4月2日、HuggingFaceが最新のLLMランキングを発表し、アリババのQwe…

Apr 2, 2025

MiniMax Audio、Speech-02音声モデルを発表 - 一度に20万文字の入力に対応

注目を集めるオーディオ技術革新企業MiniMax Audioは、最新のSpeech-02シリーズ音声モデルを発表しました。30種類以上の音声に対応し、一度に20万文字の入力が可能です。より自然でスムーズ、そして便利なオーディオ体験を提供します。今回の更新の最大の特長は、新しいSpeech-02シリーズです。公式発表によると、このシリーズは多言語対応能力が大幅に向上し、様々な言語の発音をより正確に、より自然に表現できます。さらに驚くべきことに、Speech-

Apr 2, 2025

1.3k

報道によると、MiniMaxがAI動画スタートアップ鹿影科技を買収へ

藍鯨財経ニュースの独占報道によると、人工知能動画スタートアップの鹿影科技（Avolution.ai）が、著名な人工知能企業MiniMaxに買収される見込みです。複数の関係者によると、両社は買収について基本合意に達しており、関連手続きが進められています。報道発表時点では、MiniMaxはこれについてコメントしていません。鹿影科技は2024年のエンジェルラウンドで約1億元と2000万ドルを下回る評価額だったとされています。関係者によると、鹿影科技は昨年から2回目の資金調達を模索しています。

Mar 13, 2025

大発表！MiniMax、画期的な画像生成モデル「Image-01」を発表！コストは従来の1/10

Mar 4, 2025

300

中国産AI新星がOpenAIに対抗：DeepSeek、Kimi、MiniMaxが頭角を現す

世界的な人工知能分野の競争が激化する中、中国産AIモデルが急速に台頭しています。最近、中国産AIの3強であるDeepSeek、Kimi、MiniMaxが相次いで新バージョンを発表し、OpenAIのGPTシリーズに対抗する潜在能力を示しました。1月20日、DeepSeekはDeepSeek-R1を正式に発表し、同時にモデルの重みをオープンソース化しました。DeepSeek-R1は、後学習段階で強化学習技術を大規模に使用しています。

Jan 21, 2025

5.0k

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

MiniMaxの海螺音声、世界同時リリース T2A-01-Turboモデルなど含む