Un nuevo estudio revela que GPT-4 solo alcanza una precisión del 33% en tareas de razonamiento gráfico, lo que ha generado preocupación sobre sus capacidades de procesamiento de imágenes. Los investigadores utilizaron el conjunto de datos ConceptARC para las pruebas, mostrando que la precisión media de los humanos en la misma tarea es del 91%, significativamente superior a la de GPT-4.
La metodología del estudio ha sido cuestionada, incluyendo aspectos como el reclutamiento de participantes y la forma de introducir la información. Esto pone de manifiesto las limitaciones de los grandes modelos de lenguaje en ciertas tareas y exige un examen más profundo de los métodos de investigación.