ja
AI製品ランキング
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
ホーム
AIニュース
AIデイリー
マネタイズガイド
AIチュートリアル
AIツールナビ
AI製品ライブラリ
ja
AI製品ランキング
グローバルAI製品の動向を検索
グローバルAI情報を検索して、AIの新しい機会を発見
ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル
タイプ :
ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル
2024-07-12 09:36:37
.
AIbase
.
10.2k
大規模言語モデルの推論能力は過大評価されている:未知の状況下における大きな弱点
マサチューセッツ工科大学(MIT)の研究チームは最近、大規模言語モデル(LLM)の様々なタスクにおける性能について詳細な調査を行いました。その結果、LLMは慣れたタスクでは良好な性能を示すものの、非典型的または未知の状況下では推論能力に深刻な限界があることが明らかになりました。「デフォルトタスク」と「反事実シナリオ」を比較し、タスク設計を調整してモデルの反応をテストした結果、モデルは10進数の算術演算では非常に優れていますが、非10進数の環境や、音楽、空間推論、チェスなどの他のタスクでは全く異なる性能を示すことがわかりました。