最新研究显示,GPT-4在图形推理任务上仅有33%准确率,引发了对其图形处理能力的关注。研究者使用ConceptARC数据集测试,结果显示人类在同一任务上的平均准确率为91%,远高于GPT-4。研究方法引发质疑,包括受试者招募和输入方式,突显大型语言模型在某些任务上的局限性,呼吁深入审视研究方法。