最近、マイクロソフトの研究者らが、人間の介入なしに自動的に指示データセットを進化させることができる、Auto Evol-Instructという新しいAIフレームワークを発表しました。

人工知能の分野では、大規模言語モデル(LLM)の開発が非常に重要であり、特にこれらのモデルが詳細な指示に従う能力を向上させる上で重要です。研究者らは、モデルの性能と適応性を向上させるために、LLMのトレーニングに使用されるデータセットをどのように改善できるかを模索してきました。

image.png

Evol-Instructのような従来の進化方法は、人間の専門家が進化ルールを指定する必要があるため、コストがかかり、時間がかかり、新しいタスクに適応する際には方法を再設計する必要があります。これに対し、Auto Evol-Instructは、まずLLMを使用して入力指示を分析し、進化ルールの初期方法を自律的に設計することで、自動化された進化プロセスを実現します。その後、最適化器LLMを使用して進化方法を反復的に最適化し、進化プロセスにおける問題を特定して解決することで、最終的な進化指示の複雑さと安定性を確保します。

Auto Evol-Instructは、入力指示を自動的に分析して進化ルールを作成し、LLMを使用して進化方法を設計することにより、データセットの複雑さと多様性を向上させます。

性能評価において、Auto Evol-Instructは複数のベンチマークテストで優れた性能を示しました。例えば、進化させたShareGPTデータ1万個のみを使用してMixtral-8x7Bを微調整したところ、MT-Benchで8.09点、AlpacaEvalで91.4点を達成し、GPT-3.5-TurboやWizardLM-70Bを上回り、Claude2.0と同等でした。

さらに、進化させたGSM8Kトレーニングデータ7000個のみを使用して、GSM8Kで82.49点を達成しました。コード生成においては、進化させたCode Alpacaデータ2万個を使用してDeepSeek-Coder-Base-33Bを微調整したところ、HumanEvalで77.4点を達成し、他の競合モデルを上回りました。

image.png

このように、この新しいフレームワークは、MT-Bench、AlpacaEval、GSM8K、HumanEvalなど、複数のベンチマークテストで優れた性能を示しており、指示への従順性、数学的推論、コード生成能力の向上における可能性を示しています。

論文アドレス:https://arxiv.org/abs/2406.00770

要点:

🔍 Auto Evol-Instructは、人間の介入なしに指示データセットを自動的に分析および進化させることができる、完全に自動化されたAIフレームワークです。

🚀 このフレームワークは、進化方法を最適化することで、データセットの複雑さと多様性を効果的に向上させ、さまざまなタスクにおけるLLMの性能と適応性を強化します。

💡 Auto Evol-Instructの研究結果は、指示データセットを自動的に進化させる方法を示しています。