Récemment, l'équipe de recherche sur l'IA de Microsoft a publié PromptWizard, un outil open source basé sur un framework d'IA piloté par la rétroaction, conçu pour optimiser efficacement la conception des invites pour les grands modèles linguistiques (LLM). La qualité des invites est essentielle à la qualité des résultats du modèle. Cependant, la création d'invites de haute qualité demande souvent beaucoup de temps et de ressources humaines, surtout pour des tâches complexes ou spécifiques à un domaine.

image.png

Les méthodes traditionnelles d'optimisation des invites reposent souvent sur l'expérience humaine, une approche non seulement chronophage, mais aussi difficilement extensible. Les techniques d'optimisation existantes se divisent en deux catégories : continues et discrètes. Les techniques continues, comme les invites douces, nécessitent d'énormes ressources de calcul, tandis que les méthodes discrètes comme PromptBreeder et EvoPrompt génèrent plusieurs variantes d'invites pour les évaluer. Bien que ces méthodes fonctionnent bien dans certains cas, elles manquent de mécanismes de rétroaction efficaces, conduisant souvent à des résultats insatisfaisants.

image.png

PromptWizard introduit un mécanisme de rétroaction, utilisant une approche critique et synthétique pour optimiser itérativement les instructions et les exemples d'invites, améliorant ainsi considérablement les performances des tâches. Son workflow se divise en deux phases : une phase de génération et une phase de test et d'inférence. Pendant la phase de génération, le système utilise un grand modèle linguistique pour générer plusieurs variantes basées sur une invite de base, et les évalue pour identifier les candidats performants. Simultanément, un mécanisme critique intégré analyse les forces et les faiblesses de chaque invite, fournissant une rétroaction pour guider l'optimisation ultérieure. Après plusieurs cycles d'optimisation, le système améliore la diversité et la qualité des invites.

Pendant la phase de test et d'inférence, les invites et les exemples optimisés sont appliqués à de nouvelles tâches pour garantir une amélioration continue des performances. Grâce à cette méthode, PromptWizard a été testé de manière approfondie sur 45 tâches, obtenant d'excellents résultats en configurations supervisée et non supervisée. Par exemple, il a atteint une précision de 90 % en non supervisé sur le jeu de données GSM8K et de 82,3 % sur SVAMP. De plus, par rapport aux méthodes discrètes comme PromptBreeder, PromptWizard réduit jusqu'à 60 fois le nombre d'appels API et l'utilisation de jetons, démontrant son efficacité dans les environnements aux ressources limitées.

image.png

Le succès de PromptWizard réside dans son optimisation séquentielle innovante, sa critique guidée et l'intégration de rôles d'expert, lui permettant de s'adapter efficacement aux tâches spécifiques et d'offrir une bonne explicabilité. Cette avancée souligne l'importance des frameworks automatisés dans les workflows de traitement du langage naturel et devrait favoriser une application plus efficace et économique des technologies IA avancées.

Blog : https://www.microsoft.com/en-us/research/blog/promptwizard-the-future-of-prompt-optimization-through-feedback-driven-self-evolving-prompts/

Code du projet : https://github.com/microsoft/PromptWizard?tab=readme-ov-file

Article : https://www.microsoft.com/en-us/research/publication/promptwizard-task-aware-agent-driven-prompt-optimization-framework/

Points clés :

🌟 PromptWizard est un nouveau framework d'IA pour optimiser les invites des grands modèles linguistiques et améliorer les performances du modèle.

🔍 Ce framework combine un mécanisme critique et une boucle de rétroaction pour générer et évaluer efficacement plusieurs variantes d'invites.

💰 PromptWizard affiche une précision exceptionnelle sur plusieurs tâches et réduit considérablement la consommation de ressources et les coûts.