Recientemente, nueve grandes modelos de lenguaje fallaron al responder preguntas de matemáticas de primaria en una prueba, lo que revela las limitaciones de estos modelos. Los modelos de iFlytek y Baidu mostraron un rendimiento más destacado en la prueba, mientras que MiniMax obtuvo los peores resultados.
Prueba de modelos de IA de gran tamaño: incapaces de resolver problemas de matemáticas de primaria
