TOFUデータセットは、存在しない200人の著者を仮想的に生成した質疑応答ペアを含んでおり、大規模言語モデルの現実的なタスクにおける忘却性能を評価するために使用されます。このタスクの目標は、様々な忘却セットの割合で微調整されたモデルを忘却させることです。このデータセットは質疑応答形式を採用しており、Llama2、Mistral、Qwenなどの一般的なチャットモデルに非常に適しています。しかし、他の任意の大規模言語モデルにも適用可能です。対応するコードベースはLlama2チャットとPhi-1.5モデル向けに記述されていますが、他のモデルにも容易に適合させることができます。