研究人员成功诱导AI聊天机器人泄露有害内容站长之家发布于AI新闻资讯 · 1 分钟阅读 · 2023年12月12号 9:3632 普渡大学的研究人员设计了一种新的方法,成功地诱导大型语言模型生成有害内容。他们警告人工智能社区应慎重开源语言模型,并提出清除有害内容是更好的解决方案。研究结果揭示了隐藏在合规回答中的潜在危害,该方法成功率高达98%。大型语言模型合规回答概率数据© 版权所有 AIbase基地 2024, 点击查看来源出处 - https://www.aibase.com/zh/news/4070