瑞士苏黎世联邦理工学院研究人员在论文中指出,GPT-4等大语言模型已经具备从公共论坛帖子中自动推断出用户的年龄、性别、地理位置等个人隐私信息的能力。在Reddit数据集上的实验表明,GPT-4的预测准确度在多项指标上超过60%。随着模型规模的扩大,其推断能力也在增强。作者还通过对话机器人实验证明了提取隐私信息的可行性。专家警告说要从海量训练数据中识别并移除个人信息几乎不可能,多方面的隐私保护措施目前还跟不上模型快速发展的步伐。