Recentemente, nove grandes modelos de linguagem falharam em responder a problemas de matemática olímpica do ensino fundamental em um teste, revelando as limitações desses modelos. Os modelos de linguagem da iFlytek e da Baidu tiveram um desempenho mais destacado no teste, enquanto o MiniMax ficou em último lugar.