L'équipe FAIR de Meta a récemment lancé Dualformer, un nouveau modèle Transformer qui imite le double système cognitif humain. Il intègre de manière transparente des modes de raisonnement rapide et lent, réalisant ainsi des progrès significatifs en termes de capacité de raisonnement et d'efficacité de calcul.
Le processus de pensée humaine est généralement considéré comme étant contrôlé par deux systèmes : le système 1, rapide et intuitif, et le système 2, plus lent mais plus logique.
Les modèles Transformer traditionnels ne simulent généralement qu'un seul de ces deux systèmes, ce qui entraîne des modèles soit rapides mais peu performants en termes de raisonnement, soit performants en raisonnement mais lents et coûteux en calcul.
L'innovation de Dualformer réside dans sa méthode d'entraînement. Les chercheurs ont utilisé des trajectoires de raisonnement aléatoires pour entraîner le modèle, en supprimant aléatoirement différentes parties des trajectoires pendant l'entraînement. Cela ressemble à l'analyse du processus de pensée humaine et à la création de raccourcis. Cette stratégie d'entraînement permet à Dualformer de basculer de manière flexible entre différents modes lors du raisonnement :
Mode rapide : Dualformer ne fournit que la solution finale, très rapidement.
Mode lent : Dualformer fournit la chaîne de raisonnement complète et la solution finale, offrant une capacité de raisonnement supérieure.
Mode automatique : Dualformer peut choisir automatiquement le mode approprié en fonction de la complexité de la tâche.
Les résultats expérimentaux montrent que Dualformer excelle dans des tâches telles que la navigation dans un labyrinthe et la résolution de problèmes mathématiques. En mode lent, Dualformer réussit à résoudre des tâches de navigation dans un labyrinthe de 30x30 avec un taux de réussite de 97,6 %, surpassant le modèle Searchformer entraîné uniquement avec des trajectoires de raisonnement complètes, tout en réduisant le nombre d'étapes de raisonnement de 45,5 %.
En mode rapide, le taux de réussite de Dualformer atteint également 80 %, ce qui est bien supérieur à celui du modèle Solution-Only entraîné uniquement avec des solutions finales. En mode automatique, Dualformer maintient un taux de réussite élevé tout en réduisant considérablement le nombre d'étapes de raisonnement.
Le succès de Dualformer montre que l'application des théories de la cognition humaine à la conception de modèles d'intelligence artificielle peut améliorer efficacement les performances des modèles. Cette fusion de la pensée rapide et lente offre de nouvelles pistes pour la construction de systèmes d'IA plus puissants et plus efficaces.
Adresse de l'article : https://arxiv.org/pdf/2410.09918