Mistral AIは先日、最新世代の大規模言語モデルMistral Large2を発表しました。このモデルは、コスト効率、速度、性能の面で著しい進歩を遂げています。

モデル概要

Mistral Large2は、1,230億個のパラメータを持つモデルで、128Kのコンテキストウィンドウを備えています。英語、フランス語、ドイツ語、スペイン語、イタリア語、ポルトガル語、アラビア語、ヒンディー語、ロシア語、中国語、日本語、韓国語など数十の言語、そしてPython、Java、C、C++、JavaScript、Bashなど80種類以上のプログラミング言語をサポートしています。

性能のハイライト

QQ_1721867063415.png

汎用性能:MMLUテストにおいて、Mistral Large2の事前学習版は84.0%の精度を達成しました。

QQ_1721867086970.png

QQ_1721867110778.png

コードと推論能力:コード生成と数学的推論において、Mistral Large2はGPT-4、Claude3Opus、Llama3405Bなどのトップレベルのモデルと同等の性能を示しました。

QQ_1721867130761.png

多言語能力:多言語MMLUベンチマークテストにおいて、Mistral Large2は優れた多言語処理能力を示し、特に英語、フランス語、ドイツ語などの主要言語で高い性能を発揮しました。

指示への追従と整合性:MT-Bench、Wild Bench、Arena Hardなどのベンチマークテストにおいて、Mistral Large2は指示への追従と対話能力を大幅に向上させました。

ツール使用と関数呼び出し:このモデルは、並列および順次関数呼び出しを熟練して実行するように訓練されており、複雑なビジネスアプリケーションに強力なサポートを提供します。

技術特性

「幻覚」現象を大幅に削減し、出力の信頼性と精度を向上させました。

解決策が見つからない場合や情報が不足している場合の自己認識能力を強化しました。

簡潔で要点を絞った回答の生成に重点を置き、インタラクションの効率性とコスト効率を向上させました。

応用と可用性

Mistral Large2は現在、「mistral-large-2407」という名称でla Plateformeで提供されています。

モデルの重みは公開されており、HuggingFaceでホストされています。

Mistral AIはGoogle Cloud Platformとの協業を拡大し、Vertex AIを通じてManaged APIサービスを提供しています。

このモデルは、Azure AI Studio、Amazon Bedrock、IBM watsonx.aiなどのクラウドサービスプロバイダーからもアクセスできます。

ライセンスと利用条件

Mistral Large2はMistral Research Licenseの下で公開されており、研究および非商業目的での使用が許可されています。商業目的での使用には、Mistral Commercial Licenseの取得が必要です。

この新しいモデルの発表は、Mistral AIが大型言語モデル分野で大きな進歩を遂げたことを示しており、人工知能アプリケーション開発者に、より強力で柔軟なツールを提供し、様々な業界の革新的なアプリケーションを促進すると期待されています。