フランスのAIスタートアップ企業Mistral AIは、Le Chat AIアシスタントに、統合されたウェブ検索、画像生成、そして新しく発表されたPixtral Largeモデルを含む一連の新機能を追加したと発表しました。

image.png

Le Chat機能のアップグレード

ユーザーは、Le Chatを通じてリアルタイムでウェブコンテンツにアクセスし、必要な情報を簡単に取得できるようになりました。同時に、Black Forest LabsのFlux Proモデルを利用して、高品質の画像を生成し、様々な創作ニーズを満たすことができます。

ウェブ検索と画像生成に加えて、Le Chatにはキャンバスインターフェースが導入され、ユーザーはチャットウィンドウ内で生成されたコンテンツを直接編集できるようになりました。この機能により、ユーザーはドキュメントの作成、プレゼンテーションの作成、コードの編集を、応答を再生成することなく行うことができ、作業効率が大幅に向上します。

Pixtral Largeモデルの発表

Mistral AIが発表したPixtral Largeモデルは、ビジュアルタスクにおいて非常に優れた性能を発揮します。このモデルはMistral Large2をベースに構築されており、複数の業界ベンチマークテストで優れた成績を収めています。

例えば、数学的推論テストであるMathVistaでは、Pixtral Largeは69.4%というスコアを獲得し、GPT-4oやGemini1.5Proなどの競合他社を上回りました。

image.png

また、グラフや複雑なドキュメントの分析能力も高く評価されており、グラフ、表、数式など、様々な情報を処理できます。

Pixtral Largeモデルは、1230億パラメーターのマルチモーダルデコーダーと10億パラメーターのビジュアルエンコーダーを組み合わせ、最大128枚の高解像度画像を同時に処理でき、最大コンテキストウィンドウは30Kに達します。

これにより、ドキュメント分析や複雑な画像処理において優れた性能を発揮します。Mistral AIは、Pixtral LargeをHugging Faceプラットフォーム上で学術ライセンスと商用ライセンスの両方で提供し、様々なユーザーによる研究と応用を容易にすると述べています。

さらに、Mistral AIはMistral Large言語モデルを更新し、ロングコンテキストの理解と関数呼び出しの精度を向上させました。

更新されたモデルはMistralのAPIを通じて提供され、すぐにGoogle CloudとMicrosoft Azureで利用可能になります。

Pixtral Large論文へのリンク:https://arxiv.org/abs/2410.07073

モデルページ:https://huggingface.co/mistralai/Pixtral-Large-Instruct-2411

Le Chatへのリンク:https://auth.mistral.ai/ui/login?flow=b3e9d399-afc8-497b-8f8d-99900b447c08

APIへのリンク:https://docs.mistral.ai/api/

要点:

🌐 Mistral AIはLe Chatアシスタントにウェブ検索と画像生成機能を追加し、ユーザーはリアルタイムでウェブコンテンツを取得できます。

🖌️ 新しいキャンバスインターフェースにより、ドキュメントの作成、プレゼンテーションの作成、コードの編集がより簡単になります。

📈 Pixtral Largeモデルは、複数のビジュアルタスクで優れた性能を発揮し、主要な競合他社の性能を上回っています。