MetaのAIモデルMaverick、評価版と公開版で性能に大きな違いがあると指摘

AIbase基地

公開日AIニュース · 1 分で読めます · Apr 7, 2025

Metaは土曜日、新しい主力AIモデルMaverickを発表しました。このモデルは、LM Arenaの評価で2位にランクインしました。LM Arenaは、人間の評価者が異なるモデルの出力結果を比較し、好ましいものを選択するテストプラットフォームです。しかし、多くのAI研究者はすぐに、MetaがLM Arenaに展開したMaverickのバージョンは、開発者が広く使用しているバージョンと著しく異なることに気づきました。

Facebook メタバース meta

Metaは発表の中で、LM Arena上のMaverickは「実験的なチャットバージョン」であることを認めました。同時に、Llamaの公式ウェブサイトのグラフは、MetaのLM Arenaテストでは「対話用に最適化されたLlama4Maverick」が使用されていることを示しています。この違いは、研究コミュニティの疑問を招いています。

AI研究者は、ソーシャルプラットフォームX上で、公開してダウンロード可能なMaverickと、LM Arenaでホストされているバージョンとの間に、明らかな行動の違いがあると指摘しました。LM Arenaのバージョンの特徴は、大量の絵文字を使用し、冗長な回答を提供することです。これは標準バージョンでは一般的ではありません。Nathan Lambertという研究者はX上でこの発見を共有し、「Llama4はちょっと煮詰まりすぎてるな、ははは、これはヤップタウンのどこだ？」と皮肉を込めてコメントし、関連するスクリーンショットを添付しました。

特定のベンチマークテストに合わせてモデルを調整し、その後「オリジナル」バージョンを公開するという手法は、深刻な問題を引き起こします。主な理由は、開発者が実際のアプリケーションシナリオでのモデルの性能を正確に予測することが難しくなるためです。さらに、この手法は、ベンチマークテストの目的が、さまざまなタスクにおける個々のモデルの長所と短所の客観的なスナップショットを提供することであるため、誤解を招くものと見なされています。

LM Arenaはさまざまな理由から、AIモデルのパフォーマンスを測定するための最も信頼できる指標とは見なされていませんが、通常、AI企業は、評価でより良いスコアを得るためにモデルを特別に最適化していることを公に認めることはありません。Metaのこの手法は、この慣例を破ったように見え、AIモデル評価の透明性に関するより広範な議論を引き起こしています。

Maverick Llama LMArena Meta

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

クォークAI搭載！アリババスマートAIグラス、2025年末発売か

Apr 8, 2025

Meta幹部がLlama 4の訓練における不正行為の噂に回答：虚偽の告発を断固として否定

Apr 8, 2025

Meta Llama 4登場、長文コンテキストタスクでつまずく

Apr 8, 2025

作家たちがMetaによる著作権侵害を抗議、AIトレーニングデータへの無断利用で議論勃発

先週、約100名の作家がロンドンのMeta本社前で抗議行動を起こし、同社による著作権者の許可を得ないAIモデルトレーニングのための作品利用を非難しました。抗議者たちは「Meta、Meta、本の泥棒！」と叫び、中には「スローガンを書こうとしたが、盗まれるだろう」や「ザッカーバーグを本の元に戻せ」といったプラカードを掲げる者もいました。これは明らかにMeta CEOのマーク・ザッカーバーグ氏への皮肉です。以前から、ザッカーバーグ氏がLibGenと呼ばれる…（以下略）

Apr 7, 2025

Meta、Llama 4大言語モデルを発表：混合専門家アーキテクチャがAIの新時代をリード

Meta社は、最新のオープンソース人工知能モデルLlama 4を発表し、人工知能分野における新たな大きな進歩を示しました。Llama 4はScoutとMaverickの2つのバージョンがあり、AIモデルの機能とパフォーマンスを向上させることを目指しています。Metaによると、Llama 4はテキスト、画像、ビデオ、オーディオなど、複数のデータタイプを処理し、これらの形式間で自由に変換できるマルチモーダル大規模言語モデルです。特筆すべきは、Llama 4シリーズが初めて…

Apr 7, 2025

Meta、ネイティブマルチモーダルLlama 4のオープンソース化を発表、その強力な性能に注目が集まる

アメリカのテクノロジー大手Metaが、同社が開発した最も強力なオープンソースAIモデルLlama 4を発表しました。今回の初回リリースでは、Llama4ScoutとLlama4Maverickの2つのモデルが公開されました。Llama4Scoutは、1090億のパラメータ、170億のアクティブパラメータ、16のエキスパートを備え、最大の特徴は1000万コンテキストをサポートしている点です。これは、20時間以上のビデオを処理できることに相当し、単一のH100 GPU（Int4量子化後）上で動作します。

Apr 6, 2025

DeepSeekと清華大学による共同研究：革新的な報酬モデル推論方法による拡張性の向上

DeepSeekと清華大学(ツィンファ大学)の研究者らが先日、新たな論文を発表し、報酬モデルの推論におけるスケーリング手法について論じています。これにより、DeepSeek R2は更なる進歩を遂げたと言えるでしょう。現在、強化学習は大規模言語モデルの広範な事後学習段階で広く用いられていますが、大規模言語モデルに対して正確な報酬信号を取得することに課題があります。研究者らは、点状生成報酬モデリング(GRM)を採用することで、モデルの適応能力と推論段階における拡張性を向上できることを発見しました。そのため、彼らは自己原則批評調整(SPCT)学習を提案しています。

Apr 5, 2025

190

Metaのハイエンドスマートグラス「Hypernova」リーク：内蔵ディスプレイ搭載、価格は1400ドルか

ブルームバーグの報道によると、Metaは内蔵ディスプレイを搭載したレイバンMetaスマートグラスのハイエンド版を準備中で、早ければ年末にも発売される可能性がある。Hypernovaと呼ばれるこの新型グラスは、アプリケーションの実行や写真の表示をサポートし、ジェスチャーやフレーム両側の静電容量式タッチで操作できる。報道によると、Hypernovaのディスプレイは右レンズの右下象限にのみ表示され、ユーザーが下方向に視線を向けた際に最適な表示となる。デバイス起動後は、メイン画面にアイコンが水平に表示され、レイアウトはMetaと類似している。

Apr 3, 2025

Meta人工知能研究担当副社長ジョエル・ピノが退社へ

Metaの人工知能研究担当副社長、ジョエル・ピノ（Joelle Pineau）氏は火曜日にFacebookを通じて、5月に会社を退社する予定であると発表しました。Meta内部の人工知能研究ラボ（FAIR）で2年以上勤務した同氏は、業界で高い評価を受けており、同社のAI分野におけるイノベーションと発展を指導してきました。ピノ氏の退社は、Metaが人工知能への投資を拡大している重要な時期に発生しています。同社は2025年までに最大650億ドルを投資する計画です。

Apr 2, 2025

Meta、AIシステムMoChaを発表：テキストが生き生きとしたアニメキャラクターに、口パクと動きは自然で滑らか

Metaとウォータールー大学の研究者らが最近、テキストによる簡単な説明から、同期した音声と自然な動きのある全身アニメーションキャラクターを生成できる、MoChaという新しいAIシステムを発表しました。この革新的な技術は、コンテンツ制作の効率と表現力を大幅に向上させ、多くの分野で大きな可能性を秘めています。従来の方法を打ち破り、全身アニメーションと正確な口パクを同期させる、これまでのAIモデルが主に顔の表情に焦点を当てていたのに対し、MoChaは全身の自然な動きをレンダリングできる点がユニークです。

Apr 2, 2025

AIニュース

AIデイリー

AIタイムライン

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

MetaのAIモデルMaverick、評価版と公開版で性能に大きな違いがあると指摘

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

クォークAI搭載！アリババスマートAIグラス、2025年末発売か

Meta幹部がLlama 4の訓練における不正行為の噂に回答：虚偽の告発を断固として否定

Meta Llama 4登場、長文コンテキストタスクでつまずく

作家たちがMetaによる著作権侵害を抗議、AIトレーニングデータへの無断利用で議論勃発

Meta、Llama 4大言語モデルを発表：混合専門家アーキテクチャがAIの新時代をリード

Meta、ネイティブマルチモーダルLlama 4のオープンソース化を発表、その強力な性能に注目が集まる

DeepSeekと清華大学による共同研究：革新的な報酬モデル推論方法による拡張性の向上

Metaのハイエンドスマートグラス「Hypernova」リーク：内蔵ディスプレイ搭載、価格は1400ドルか

Meta人工知能研究担当副社長ジョエル・ピノが退社へ

Meta、AIシステムMoChaを発表：テキストが生き生きとしたアニメキャラクターに、口パクと動きは自然で滑らか