MiniMax大規模言語モデル、日平均30億回ユーザーとインタラクション、マルチモーダルモデルも発表へ

AIbase基地

公開日AIニュース · 1 分で読めます · Sep 3, 2024

378

MiniMax稀宇科技は先日、2021年末の設立以来、兆パラメーター規模のMoEテキスト大規模言語モデル、音声大規模言語モデル、画像大規模言語モデルを構築し、「星野」、「海螺AI」などのネイティブアプリをリリース、企業や開発者向けにオープンなプラットフォームAPIを提供してきたと発表しました。

過去996日間で、MiniMaxの大規模言語モデルは、1日平均30億回のユーザーとのインタラクションを行い、3兆を超えるテキストトークンを処理し、2000万枚の画像と7万時間の音声データを生成しました。これらのインタラクションは、同社の人工知能分野における急速な進歩と広範な影響を示しています。

微信截图_20240903084728.png

MiniMaxの創設者IOは、目覚ましい進歩を遂げたものの、世界人口の100％をスマートに繋げるという目標達成にはまだ長い道のりがあると強調しました。この目標達成のため、MiniMaxは技術革新に引き続き注力し、特にモデルのエラー率の低減、無限長の入出力のサポート、マルチモーダルインタラクションなど重要な分野に注力していきます。

今回のパートナーデーでは、MiniMaxはビデオモデルabab-video-1、音楽モデルabab-music-1を発表し、音声モデルabab-speech-1をアップデートしました。さらに、MiniMaxは今後数週間以内に、MoE + Linear Attention技術を採用したマルチモーダルモデルabab7をリリースする予定です。

微信截图_20240903084734.png

さらに、MiniMaxは、複数の言語と感情表現に対応した音声モデル、高圧縮率と多様なスタイルを備えたビデオモデルなど、高度な音声およびビデオモデルも発表しました。これらのモデルは、同社のオープンなプラットフォームと「星野」、「海螺AI」などの製品を通じて、ユーザーと開発者に提供されます。

中国産AI新星がOpenAIに対抗：DeepSeek、Kimi、MiniMaxが頭角を現す

世界的な人工知能分野の競争が激化する中、中国産AIモデルが急速に台頭しています。最近、中国産AIの3強であるDeepSeek、Kimi、MiniMaxが相次いで新バージョンを発表し、OpenAIのGPTシリーズに対抗する潜在能力を示しました。1月20日、DeepSeekはDeepSeek-R1を正式に発表し、同時にモデルの重みをオープンソース化しました。DeepSeek-R1は、後学習段階で強化学習技術を大規模に使用しています。

MiniMaxの海螺音声、世界同時リリース　T2A-01-Turboモデルなど含む

上海稀宇科技有限公司傘下のMiniMaxは、新たにアップグレードされたT2A-01シリーズの音声モデルを世界同時リリースし、海螺音声製品を発表しました。T2A-01シリーズには、T2A-01-HDとT2A-01-Turboの2つのモデルがあり、APIサービスはMiniMaxオープンソースプラットフォームで同時にリリースされています。企業は、音声品質と生成速度のニーズに合わせてモデルを選択できます。

海螺AI海外版、新しい音声モデルT2A-01-HDを発表音質が向上

2024年末に海螺AI海外版がAI音声クローン機能をリリースしたのに続き、Hailuo AIは先日、新しい音声モデルT2A-01-HDを発表しました。T2A-01-HDは音声クローンに対応し、感情豊かな音声を生成できます。公式によると、T2A-01-HDは元の音声モデルをベースに音質が向上し、優れたクローン精度を実現しています。ただし、T2A-01-HDは現在オープンソース化されておらず、ユーザーはWebサイトで無料で利用できます。Hailuo AIへアクセス