最近、9つの大規模言語モデルが小学算数の問題に解答できず、その限界が明らかになりました。科大訊飛と百度のモデルは比較的良い成績でしたが、MiniMaxは最下位でした。