在大学考试的考场上,AI的"入侵"已经悄然发生。英国雷丁大学的研究揭示了一个惊人的现象:在实际的大学考试中,94%的AI生成的答案竟然逃过了教师的法眼,未被识破。更令人震惊的是,这些AI"同学"在83.4%的情况下成绩还显著高于人类学生。这似乎预示着,AI不仅在替代人类工作方面展现出潜力,甚至在认知任务上也开始超越大学生。

这项研究并非发生在封闭的实验室,而是在真实的考试环境中。研究团队在雷丁大学的心理学和临床语言科学学院进行了一场"图灵测试",却没有告知评分员。考试包括简答题和论文题,AI生成的内容被混入其中,占比约5%。研究人员使用标准化的提示词让GPT-4生成答案,但未对内容进行任何修改,以保证AI的"真实性"。

image.png

评分过程遵循雷丁大学的严格标准,包括初步评分、独立审核和评分团队的校准会议。然而,即便在这样的审查下,AI提交的作业仍然难以被识破。研究结果显示,AI生成的作业在多个模块中未被发现,且成绩往往集中在高分区域。

这一发现引发了对学术诚信和教育目标的深刻反思。如果学生能够利用AI生成高质量内容,并且很难被发现,那么我们应该如何改革教育体系,以适应这一新兴技术?去年,《自然》杂志的一篇论文也指出,AI在完成大学课程作业时已经展现出信息搜索、集成和批判性分析的能力,这与大学培养目标不谋而合。

这项研究的结论无疑是令人担忧的。GPT-4的能力使得学生在利用AI作弊的情况下很难被发现,而且有极高的概率能取得更好的成绩。这不仅对学术诚信构成挑战,也促使我们思考教育的未来方向。尽管有网友戏谑地质疑这项研究是否也是AI完成的,但作者郑重声明,研究内容完全是人类进行的。