Récemment, des chercheurs de Microsoft ont présenté un nouveau framework d'IA appelé Auto Evol-Instruct, capable d'améliorer automatiquement les ensembles de données d'instructions sans aucune intervention humaine.

Dans le domaine de l'intelligence artificielle, le développement des grands modèles de langage (LLM) est crucial, notamment pour améliorer leur capacité à suivre des instructions détaillées. Les chercheurs explorent constamment des moyens d'améliorer les ensembles de données utilisés pour entraîner les LLM afin d'accroître leurs performances et leur adaptabilité.

image.png

Les méthodes d'évolution traditionnelles, telles qu'Evol-Instruct, reposent sur des règles d'évolution définies par des experts humains. Cette approche est non seulement coûteuse et chronophage, mais nécessite également une refonte de la méthode pour s'adapter à de nouvelles tâches. En revanche, Auto Evol-Instruct automatise le processus d'évolution en commençant par analyser les instructions d'entrée à l'aide de LLM et en concevant de manière autonome une méthode initiale de règles d'évolution. Ensuite, des LLM optimiseurs itèrent et affinent la méthode d'évolution, identifiant et résolvant les problèmes rencontrés afin de garantir la complexité et la stabilité des instructions d'évolution finales.

Auto Evol-Instruct améliore la complexité et la diversité des ensembles de données en analysant automatiquement les instructions d'entrée et en définissant des règles d'évolution, le tout grâce à la conception de méthodes d'évolution par les LLM.

En termes d'évaluation des performances, Auto Evol-Instruct a excellé dans plusieurs tests de référence. Par exemple, en utilisant seulement 10 000 données ShareGPT améliorées pour le réglage fin de Mixtral-8x7B, le framework a atteint un score de 8,09 sur MT-Bench et de 91,4 sur AlpacaEval, surpassant GPT-3.5-Turbo et WizardLM-70B, et se rapprochant de Claude2.0.

De plus, en utilisant seulement 7 000 données d'entraînement GSM8K améliorées, le framework a atteint un score de 82,49 sur GSM8K. En matière de génération de code, en utilisant 20 000 données Code Alpaca améliorées pour le réglage fin de DeepSeek-Coder-Base-33B, le framework a atteint un score de 77,4 sur HumanEval, dépassant d'autres modèles concurrents.

image.png

Il est clair que ce nouveau framework a excellé dans plusieurs tests de référence, notamment MT-Bench, AlpacaEval, GSM8K et HumanEval, démontrant son potentiel pour améliorer le respect des instructions, le raisonnement mathématique et la capacité de génération de code.

Adresse de l'article : https://arxiv.org/abs/2406.00770

Points clés :

🔍 Auto Evol-Instruct est un framework d'IA entièrement automatique capable d'analyser et d'améliorer automatiquement les ensembles de données d'instructions sans intervention humaine.

🚀 Le framework, grâce à l'optimisation des méthodes d'évolution, améliore efficacement la complexité et la diversité des ensembles de données, augmentant ainsi les performances et l'adaptabilité des LLM dans diverses tâches.

💡 Les résultats de la recherche sur Auto Evol-Instruct montrent l'efficacité d'une méthode d'amélioration automatique des ensembles de données d'instructions.