研究によると、GPT-3のような大規模事前学習言語モデル(LLM)は、人間の質問への理解と回答、コーディング支援など、優れた能力を備えています。
最近、研究者らはLLMが追加データや微調整なしで自己評価と改善を行うことができるRAIN手法を導入しました。
この手法は、LLMのパフォーマンス向上だけでなく、敵対的攻撃の成功率の低下にもつながり、より調和のとれた安全なAIによる応答生成を実現します。
この研究は、追加情報や煩雑な微調整なしに、人間の好みに合わせてLLMを調整するための新たな方法を提供します。