研究表明,大型预训练语言模型(LLM),如GPT-3,具有出色的能力,可以理解和回答人类提出的问题,协助编码工作等。最近,研究人员引入了RAIN方法,使LLM能够自我评估和改进,无需额外数据和微调。这一方法不仅提高了LLM的性能,还降低了对敌对攻击的成功率,为AI生成更协调和安全的响应。这项研究为调整LLM以满足人类偏好提供了一种新的方法,无需额外信息或繁琐的微调。