OpenAIの社員がxAIに公開で疑問を呈する:Grok 3のベンチマークテスト結果が誤解を招く

AIbase基地
90
最近、人工知能ベンチマークテストに関する議論が公の場で激化しています。OpenAIの社員がマスク創設のAI企業xAIが誤解を招くGrok3のベンチマークテスト結果を発表したと非難し、xAIの共同創設者イーゴール・バブシンキンは会社に問題はないと主張しています。この事態の発端は、xAIがブログにGrok3のAIME2025テストでのパフォーマンスを示すグラフを発表したことです。AIME2025は最近行われた数学招待大会の一環です。
© 著作権 AIbase基地 2024, 出典元はこちら - https://www.aibase.com/ja/news/15647