楽天、初の日本的大規模言語モデル「Rakuten AI 2.0」を発表

AIbase基地

公開日AIニュース · 1 分で読めます · Feb 13, 2025

251

楽天グループは、日本初となる大規模言語モデル（LLM）と小型言語モデル（SLM）である「Rakuten AI2.0」と「Rakuten AI2.0mini」を発表しました。

これらのモデルの発表は、日本の人工知能（AI）の発展を促進することを目的としています。Rakuten AI2.0は、混合専門家（MoE）アーキテクチャに基づいた8x7Bのモデルで、それぞれ70億パラメーターを持つ8つのモデル（専門家）で構成されています。入力トークンを処理する際、システムは最も関連性の高い2つの専門家に送信し、ルーターが選択を行います。これらの専門家とルーターは、大量の高品質な日英バイリンガルデータを用いて共同学習を繰り返します。

Rakuten AI2.0miniは、15億パラメーターの新しい高密度モデルで、コスト効率の高いエッジデバイスへの展開を目的としており、特定のアプリケーションシナリオに適しています。日英混合データで学習されており、手軽なソリューションを提供することを目指しています。両モデルとも、指示微調整と選好最適化が施されており、基本モデルと指示モデルが公開され、企業や専門家がAIアプリケーションを開発できるようになっています。

すべてのモデルはApache2.0ライセンスで提供され、楽天グループのHugging Face公式リポジトリから入手できます。商業利用としては、テキスト生成、要約、質問応答、テキスト理解、対話システム構築などが含まれます。さらに、これらのモデルは他のモデルの基盤としても使用でき、さらなる開発や応用が容易になります。

楽天グループの最高AI・データ責任者である蔡婷氏は次のように述べています。「データ、エンジニアリング、科学を融合させ、Rakuten AI2.0を発表できたことを大変誇りに思います。私たちの新しいAIモデルは、企業が賢明な意思決定を行い、価値実現を加速し、新たな可能性を切り開くための、強力でコスト効率の高いソリューションを提供します。モデルをオープンにすることで、日本におけるAIの発展を加速し、すべての日本企業が構築、実験、成長を促し、協調的なコミュニティを構築することを願っています。」

公式ブログ:https://global.rakuten.com/corp/news/press/2025/0212_02.html

要点:
🌟 楽天グループが日本初の大規模言語モデル（LLM）と小型言語モデル（SLM）「Rakuten AI2.0」と「Rakuten AI2.0mini」を発表。
📊Rakuten AI2.0は混合専門家アーキテクチャに基づき、70億パラメーターの専門家モデル8つで構成され、日英バイリンガルデータの高効率処理を実現。
🛠️ すべてのモデルは楽天Hugging Face公式リポジトリで入手可能。様々なテキスト生成タスクに利用でき、他のモデルの基盤としても活用可能。

大規模言語モデルの効率を1.7倍に向上：バイトダンスのCOMET技術がオープンソース化

バイトダンス傘下の豆包大規模言語モデルチームは先日、混合専門家モデル（MoE）アーキテクチャにおける主要なボトルネックを克服し、COMETという名称の重要な最適化技術をオープンソース化したと発表しました。この技術は、大規模言語モデルのトレーニング効率を大幅に向上させ、最大1.7倍の効率向上を実現し、トレーニングコストを40％削減することに成功しました。画像注記：画像はAIによって生成され、画像ライセンス提供サービスMidjourneyを使用しています。COMET技術は、バイトダンスの万規模GPUクラスタトレーニングで実際に適用されており、数百万GPU時間の節約に貢献しています。

00後がDeepSeekライブコマースで1日で3.3億元を売り上げる

最近、浙江省杭州市で、AIツールDeepSeekの人気が高まるにつれ、多くの起業家がその強力な機能を活用して収益を上げ始めています。先日、00後のあるストリーマーがDeepSeekを使ってライブコマースを行い、わずか1日で3.3億元相当の商品を販売したというニュースが注目を集めています。報道によると、DeepSeekの助けを借りて、多くの企業や個人が新しい販売方法を試みています。例えば、義烏のある店主はDeepSeekを使って在庫を完売させました。

ServiceNow、AI企業Moveworksを30億ドルで買収へ

アメリカのソフトウェア企業ServiceNowが、AIアシスタントプロバイダーのMoveworksを買収する交渉を進めていると報じられています。この取引はServiceNow史上最大規模の買収となり、取引額は約30億ドルに上る見込みです。情報筋によると、両社の協議は最終段階に入っていますが、遅延や交渉決裂の可能性も残されています。2016年設立のMoveworksは、AI駆動型の従業員アシスタントツール開発に特化しています。

智元、家庭用ロボットベースの大規模言語モデルGO-1を発表成功率が大幅に向上

3月10日、智元ロボットは、初の汎用具象ベースの大規模言語モデルであるGenie Operator-1（GO-1と略称）を発表しました。この発表は大きな注目を集め、特に家庭用サービスロボットの可能性という点において、将来の家事管理に新たな希望をもたらすものとして期待されています。智元ロボットの公式発表によると、GO-1大規模言語モデルは大量の人間のビデオ学習を通じて、コップの水を運ぶ、食事を作る、客を迎えるなど、多くの家事タスクをこなす優れた能力を示しています。技術性能に関しては、

AIニュース