MiniMax稀宇科技は先日、2021年末の設立以来、兆パラメーター規模のMoEテキスト大規模言語モデル、音声大規模言語モデル、画像大規模言語モデルを構築し、「星野」、「海螺AI」などのネイティブアプリをリリース、企業や開発者向けにオープンなプラットフォームAPIを提供してきたと発表しました。

過去996日間で、MiniMaxの大規模言語モデルは、1日平均30億回のユーザーとのインタラクションを行い、3兆を超えるテキストトークンを処理し、2000万枚の画像と7万時間の音声データを生成しました。これらのインタラクションは、同社の人工知能分野における急速な進歩と広範な影響を示しています。

微信截图_20240903084728.png

MiniMaxの創設者IOは、目覚ましい進歩を遂げたものの、世界人口の100%をスマートに繋げるという目標達成にはまだ長い道のりがあると強調しました。この目標達成のため、MiniMaxは技術革新に引き続き注力し、特にモデルのエラー率の低減、無限長の入出力のサポート、マルチモーダルインタラクションなど重要な分野に注力していきます。

今回のパートナーデーでは、MiniMaxはビデオモデルabab-video-1、音楽モデルabab-music-1を発表し、音声モデルabab-speech-1をアップデートしました。さらに、MiniMaxは今後数週間以内に、MoE + Linear Attention技術を採用したマルチモーダルモデルabab7をリリースする予定です。

微信截图_20240903084734.png

さらに、MiniMaxは、複数の言語と感情表現に対応した音声モデル、高圧縮率と多様なスタイルを備えたビデオモデルなど、高度な音声およびビデオモデルも発表しました。これらのモデルは、同社のオープンなプラットフォームと「星野」、「海螺AI」などの製品を通じて、ユーザーと開発者に提供されます。