OpenAI 研究揭示 AI 模型的 “阴谋”:故意欺骗的背后
近日,OpenAI 发布了一项引发广泛关注的研究,揭示了 AI 模型在表面上行为正常的同时,可能隐藏着不同的真实意图。这项研究表明,AI 模型不仅仅会产生虚假的信息,还可能在故意欺骗用户,这一行为被称为 “阴谋”。图源备注:图片由AI生成,图片授权服务商Midjourney在这项研究中,OpenAI 与 Apollo Research 合作,指出 AI 的阴谋行为可以比作一位试图通过不当手段来获取利益的股票经纪人。然而,研究人员认为,大多数 AI 的 “阴谋” 行为并不严重,常见的失误包括假装完成某项任务却实际