Mistral AI、中東および東南アジア言語に特化したAIモデル「Saba」を発表

AIbase基地

公開日AIニュース · 1 分で読めます · Feb 18, 2025

Mistral AIは最近、中東および東南アジア地域の言語と文化の違いへの理解を向上させることに重点を置いた、Sabaという新しい言語モデルを発表しました。

Sabaモデルは240億個のパラメータを備えており、多くの競合他社よりも規模は小さいですが、Mistral AIは、正確性を維持しながら、より高速で低コストであると主張しています。そのアーキテクチャは、Mistral Small3モデルと類似している可能性があります。Sabaは、パフォーマンスの低いシステムでも効率的に動作し、単一のGPU設定でも毎秒150トークンを超える速度を実現できます。

このモデルは、アラビア語とヒンディー語、特にタミル語やマラヤーラム語などの南インド語の処理に特に優れています。Mistral AIのベンチマークテストによると、Sabaはアラビア語で優れたパフォーマンスを示し、同時に英語と同等の能力を維持しています。

Sabaは、アラビア語の仮想アシスタントや、エネルギー、金融市場、医療などの分野の専用ツールなど、現実的なシナリオで既に利用されています。地元の方言や文化的な参照への理解により、特定の地域に特化したコンテンツを効果的に生成できます。

ユーザーは、有料APIまたはローカル展開を通じてSabaにアクセスできます。Mistral AIの他のモデルと同様に、Sabaはオープンソースモデルではありません。

Mistralのベンチマークテストによると、Sabaはアラビア語で優れたパフォーマンスを示し、同時に英語と同等の能力を維持しています | 出典:Mistral AI

Sabaの発表は、AI分野における特定地域言語モデルへのニーズの高まりを示しています。OpenGPT-Xプロジェクト（Teuken-7Bモデルを発表）、OpenAI（日本語専用のGPT-4モデルを開発）、EuroLinguaプロジェクト（ヨーロッパの言語に特化）など、他の組織も同様の研究を行っています。

従来の大規模言語モデルは、主に大量の英語テキストデータセットを使用してトレーニングされているため、特定の言語の微妙なニュアンスを見落としがちです。Sabaは、このギャップを埋めることを目指し、より正確で、現地の文化的背景に合った言語処理能力を提供します。

大規模言語モデルの効率を1.7倍に向上：バイトダンスのCOMET技術がオープンソース化

バイトダンス傘下の豆包大規模言語モデルチームは先日、混合専門家モデル（MoE）アーキテクチャにおける主要なボトルネックを克服し、COMETという名称の重要な最適化技術をオープンソース化したと発表しました。この技術は、大規模言語モデルのトレーニング効率を大幅に向上させ、最大1.7倍の効率向上を実現し、トレーニングコストを40％削減することに成功しました。画像注記：画像はAIによって生成され、画像ライセンス提供サービスMidjourneyを使用しています。COMET技術は、バイトダンスの万規模GPUクラスタトレーニングで実際に適用されており、数百万GPU時間の節約に貢献しています。

智元、家庭用ロボットベースの大規模言語モデルGO-1を発表成功率が大幅に向上

3月10日、智元ロボットは、初の汎用具象ベースの大規模言語モデルであるGenie Operator-1（GO-1と略称）を発表しました。この発表は大きな注目を集め、特に家庭用サービスロボットの可能性という点において、将来の家事管理に新たな希望をもたらすものとして期待されています。智元ロボットの公式発表によると、GO-1大規模言語モデルは大量の人間のビデオ学習を通じて、コップの水を運ぶ、食事を作る、客を迎えるなど、多くの家事タスクをこなす優れた能力を示しています。技術性能に関しては、

国家スパコンインターネットプラットフォームが阿里巴巴の千問大規模言語モデルに接続、QwQ-32B APIを提供開始

報道によると、国家スパコンインターネットプラットフォームは阿里巴巴の通義千問大規模言語モデルへの接続を発表し、千問QwQ-32B APIサービスの正式提供を開始しました。本サービスを利用するユーザーは、最大100万トークンを無料で利用でき、多くの開発者や研究者にとって絶好の機会となります。千問QwQ-32Bは阿里巴巴通義チームが最近オープンソース化した推論モデルであり、優れた性能を誇ります。複数の権威ある評価データによると、千問QwQ-32Bの能力は「フルバージョン」の671Bと匹敵します。