Récemment, neuf grands modèles de langage ont échoué à résoudre des problèmes de mathématiques élémentaires lors de tests, révélant ainsi leurs limites. Les modèles de Xunfei et Baidu se sont distingués lors des tests, tandis que MiniMax a obtenu les pires résultats.