Kürzlich scheiterten neun große Sprachmodelle in einem Test an der Beantwortung von Mathematikaufgaben der Grundschule, was die Grenzen dieser Modelle aufzeigt. Die Modelle von iFlytek und Baidu zeigten dabei die beste Leistung, während MiniMax das Schlusslicht bildete.