Recientemente, varios modelos de lenguaje de inteligencia artificial de gran tamaño han generado una gran preocupación al cometer errores al comparar números simples. Varios modelos de IA conocidos, incluyendo Byte Doubao, GPT4o, Kimi de Yue Zhi An Mian, Yue Wen de Jie Yue Xing Chen, y Bai Xiao Ying de Bai Chuan Intelligence, han dado respuestas incorrectas a preguntas básicas como "¿Cuál es mayor, 9.11 o 9.9?". Además, anteriormente se descubrió que varios modelos de IA también cometían errores al contar la cantidad de "r" en la palabra "strawberry".

Robot, escritura con IA, educación con IA

Nota de la fuente: La imagen fue generada por IA, y los derechos de la imagen pertenecen a Midjourney.

En respuesta a este fenómeno, la compañía Yue Zhi An Mian emitió un comunicado. La compañía declaró que la exploración de la capacidad de los modelos de lenguaje de gran tamaño por parte de los humanos se encuentra en una etapa muy temprana, y se necesita más investigación y pruebas para comprender tanto lo que estos modelos pueden hacer como lo que no pueden hacer.

Yue Zhi An Mian enfatizó que agradecen que los usuarios detecten e informen sobre más casos límite. Estos casos, ya sean los problemas recientes de comparación numérica o los problemas de ortografía anteriores, ayudan a comprender mejor los límites de las capacidades de los modelos de lenguaje de gran tamaño.

Sin embargo, Yue Zhi An Mian señaló que resolver estos problemas por completo no se puede lograr simplemente corrigiendo cada caso individualmente. Argumentan que estas situaciones, al igual que los escenarios que encuentra un vehículo autónomo, son difíciles de agotar. Por lo tanto, es más importante mejorar continuamente el nivel de inteligencia del modelo base subyacente, haciendo que el modelo de lenguaje de gran tamaño sea más potente y completo, capaz de ofrecer un rendimiento excelente en diversas situaciones complejas y extremas.

Este incidente ha generado un debate en la industria sobre las capacidades básicas de los modelos de lenguaje de gran tamaño de IA, y ha puesto de manifiesto los desafíos que enfrenta la tecnología de IA actual al procesar tareas aparentemente simples. Con el avance de la investigación y la tecnología, se espera que estos problemas se solucionen gradualmente.