Um estudo recente revelou que o GPT-4 apresenta uma precisão de apenas 33% em tarefas de raciocínio gráfico, levantando preocupações sobre sua capacidade de processamento de imagens. Os pesquisadores utilizaram o conjunto de dados ConceptARC para testar o modelo, e os resultados mostraram que a taxa de acerto média de humanos na mesma tarefa foi de 91%, significativamente superior à do GPT-4.
A metodologia da pesquisa, incluindo a forma como os participantes foram recrutados e a maneira como as informações foram apresentadas, foi questionada. Isso destaca as limitações dos grandes modelos de linguagem em determinadas tarefas e reforça a necessidade de uma análise mais aprofundada dos métodos de pesquisa.