最近,微软的研究人员提出了一种名为 Auto Evol-Instruct 的全新 AI 框架,这个框架可以自动演进指导数据集,无需任何人为干预。

在人工智能领域,大型语言模型(LLMs)的发展至关重要,尤其是在提高这些模型遵循详细指令的能力方面。研究人员一直在探索如何改进用于训练 LLMs 的数据集,以提高模型的性能和适应性。

image.png

传统的演进方法如Evol-Instruct依赖于人类专家指定的演进规则,这不仅昂贵耗时,而且在适应新任务时需要重新设计方法。相比之下,Auto Evol-Instruct通过首先使用LLMs分析输入指令,并自主设计演进规则的初始方法,实现了自动化演进过程。随后,通过优化器LLMs对演进方法进行迭代优化,识别和解决演进过程中的问题,确保最终的演进指令复杂性和稳定性。

Auto Evol-Instruct 通过自动分析输入指令并制定演进规则,利用 LLMs 设计演进方法,从而提高数据集的复杂性和多样性。

在性能评估方面,Auto Evol-Instruct在多个基准测试中表现出色。例如,仅使用10K个演进的ShareGPT数据对Mixtral-8x7B进行微调,框架在MT-Bench上达到了8.09分,在AlpacaEval上达到了91.4分,超过了GPT-3.5-Turbo和WizardLM-70B,并与Claude2.0相当。

此外,通过仅使用7K个演进的GSM8K训练数据,框架在GSM8K上达到了82.49分,在代码生成方面,通过使用20K个演进的Code Alpaca对DeepSeek-Coder-Base-33B进行微调,框架在HumanEval上达到了77.4分,超过了其他竞争模型。

image.png

可见,这个全新的框架在多个基准测试中表现出色,包括 MT-Bench、AlpacaEval、GSM8K 和 HumanEval,展现出其在提高指令遵循、数学推理和代码生成能力方面的潜力。

论文地址:https://arxiv.org/abs/2406.00770

划重点:

🔍 Auto Evol-Instruct 是一个全自动的 AI 框架,能够自动分析和演进指导数据集,无需人为干预。

🚀 框架通过优化演进方法,有效提高了数据集的复杂性和多样性,从而增强了 LLMs 在各种任务中的性能和适应性。

💡 Auto Evol-Instruct 的研究结果表明,通过自动化演进指导数据集的方法。