Recentemente, vários grandes modelos de inteligência artificial (IA) chamaram a atenção por cometerem erros em comparações numéricas simples. Modelos conhecidos como ByteDance Doubao, GPT4o, Yue Zhi Anmian Kimi, Jieyue Xingchen Yuewen e Baichuan Intelligence Baixiaoying, entre outros, deram respostas incorretas a perguntas básicas como "Qual é maior, 9,11 ou 9,9?". Além disso, usuários relataram erros em outros modelos de IA na contagem das letras "r" na palavra "strawberry".

Robô, IA para escrita, IA para educação

Observação da fonte: Imagem gerada por IA, serviço de licenciamento de imagens Midjourney

A empresa Yue Zhi Anmian respondeu a essa situação. A empresa declarou que a exploração da capacidade dos grandes modelos de IA ainda está em estágio muito inicial, e são necessárias mais pesquisas e testes para entender o que esses modelos conseguem e o que não conseguem fazer.

A Yue Zhi Anmian enfatizou que valoriza muito a identificação e os relatórios de casos limites (Corner Cases) feitos pelos usuários durante o uso. Esses casos, sejam os recentes problemas de comparação numérica ou os problemas de ortografia anteriores, contribuem para uma melhor compreensão dos limites da capacidade dos grandes modelos de IA.

No entanto, a Yue Zhi Anmian apontou que a solução completa desses problemas não depende apenas da correção individual de cada caso. Eles argumentam que essas situações, assim como os cenários encontrados em direção autônoma, são difíceis de esgotar. Portanto, é mais importante fortalecer continuamente o nível de inteligência do modelo básico subjacente, tornando os grandes modelos de IA mais poderosos e abrangentes, capazes de apresentar um desempenho excelente em diversas situações complexas e extremas.

Este evento gerou debates na indústria sobre a capacidade básica dos grandes modelos de IA, destacando os desafios que a tecnologia de IA atual ainda enfrenta no tratamento de tarefas aparentemente simples. Com o aprofundamento da pesquisa e o avanço da tecnologia, acredita-se que esses problemas serão gradualmente resolvidos.