フランスのAI大手、マルチモーダル戦場に襲来：Mistral AIがオープンソースの画像テキスト理解モデルPixtral 12Bを発表

AIbase基地

公開日AIニュース · 1 分で読めます · Sep 12, 2024

205

Mistral AIがAI業界に衝撃を与え、初のオープンソース多様な大規模モデルPixtral12Bを発表しました。画像とテキストの両方を処理できるこのモデルは、その先進的な技術だけでなく、オープンな姿勢も広く注目を集めています。Mistral AIはモデルの重みを直接公開し、さらに磁力リンクも提供するなど、細やかな配慮も見られます。

Pixtral12Bの注目点は、その強力な機能だけでなく、洗練された設計にもあります。モデル全体のサイズはわずか23.64GBと、多様なモデルの中では軽量級です。この特性により、消費電力と導入のハードルが大幅に低くなり、より多くの開発者や研究者が容易に利用できるようになりました。高速インターネット環境であれば、数分でダウンロードできるため、アクセシビリティも格段に向上しています。

Mistral AIの最新作であるPixtral12Bは、テキストモデルNemo12Bをベースに開発され、120億のパラメータを備えています。AnthropicのClaudeシリーズやOpenAIのGPT-4などの有名な多様なモデルに匹敵する能力を持ち、画像関連の複雑な質問を理解し、回答することができます。

技術仕様においても、Pixtral12Bは印象的です。40層のネットワーク構造、14,336個の隠れ次元、32個の注意ヘッド、そして400Mの専用のビジュアルエンコーダーを備え、1024x1024ピクセルの画像処理に対応しています。

さらに特筆すべきは、Pixtral12Bが複数の権威あるベンチマークテストで優れた成績を収めていることです。MMMU、Mathvista、ChartQA、DocVQAなどのプラットフォームで、Phi-3やQwen-27Bなどの著名な多様なモデルを上回る成績を収め、その強力な能力を証明しています。

Mistral AIのこの取り組みは、多様なモデルのオープンソース化の流れをさらに加速させるでしょう。コミュニティはこの新しいモデルに熱狂的な反応を示しており、多くの開発者や研究者がPixtral12Bの可能性を探求することに意欲を見せています。これはオープンソースコミュニティの活力を示すだけでなく、多様なAI技術が新たなイノベーションの波を迎えることを示唆しています。

Pixtral12Bの発表により、より多くの革新的なアプリケーションが登場することが期待されます。画像理解、文書分析、クロスモーダル推論など、あらゆる分野で画期的な進歩をもたらす可能性があります。Mistral AIのこの取り組みは、AI技術の民主化と普及化に大きく貢献しており、今後AI業界の状況をどのように変えていくのか、注目しましょう。

huggingfaceアドレス: https://huggingface.co/mistral-community/pixtral-12b-240910

Mistral AI、最強の文書認識モデルMistral OCRを発表：文書理解における新たな基準を確立

人工知能企業Mistral AIは本日、最新の文書認識モデルMistral OCRの正式リリースを発表しました。このモデルは「地表最強のOCR」と評されており、その卓越した性能と多機能性から、Xプラットフォーム上で活発な議論を巻き起こしています。Mistral OCRは、複雑なPDF、画像、表、数式、多言語文書からの正確なデータ抽出をサポートし、速度と正確性の両方においてGoogle Document AIやAzure OCRを凌駕しています。

Mistral AI、中東および東南アジア言語に特化したAIモデル「Saba」を発表

Mistral AIは最近、中東および東南アジア地域の言語と文化の違いに対する理解を向上させることを目的とした新しい言語モデル「Saba」を発表しました。Sabaモデルは240億のパラメータを持ち、多くの競合他社よりも規模は小さいですが、Mistral AIは、正確性を維持しながら、より高速で低コストであると主張しています。そのアーキテクチャはMistral Small3モデルと類似している可能性があります。Sabaは、パフォーマンスの低いシステムでも効率的に動作します。

Mistral AI、新しいチャットボットアプリ「Le Chat」をリリース、無料の基本版を提供

Mistral AIは最近、アップルApp Storeで新しいチャットボットアプリ「Le Chat」をリリースしました。このアプリにより、ユーザーは自然言語による会話、リアルタイムのウェブ検索、ドキュメント分析、画像生成などの機能を簡単に利用できるようになります。現在、基本的なチャット機能を利用できる無料の基本版をダウンロードできます。また、月額14.99ドルのProサブスクリプションを選択して、より高度なモデルを利用することも可能です。Mistral AIは…

フランスAIスタートアップMistral CEO、IPO計画を発表、アジア太平洋市場の拡大に注力

世界的なAI競争が激化する中、フランスのスタートアップMistral AIの創業者兼CEOであるArthur Mensch氏は、ブルームバーグテレビのインタビューで、同社は売却を検討せず、今後新規株式公開（IPO）を推進していく計画だと明言しました。Mistral AIは欧米での事業拡大を継続する一方、シンガポールにオフィスを開設し、アジア太平洋地域での影響力強化を図る計画です。2023年の設立以来