Face-à-face intellectuel : un professeur de mathématiques et GPT o1 mini résolvent un problème en 43 secondes

À l'Université de Pennsylvanie, un professeur de mathématiques, Robert Ghrist, s'est lancé dans une fascinante « joute intellectuelle » avec un modèle d'IA appelé GPT-o1-mini. Alors qu'il tentait de démontrer une généralisation plus complexe du théorème de la dualité du goulot d'étranglement, le professeur a connu de nombreux hauts et bas.

Ghrist avait auparavant essayé plusieurs modèles d'IA renommés, notamment GPT-4, Claude-3.5 et Gemini-1.5-Pro. Bien que ces modèles aient pu formuler des hypothèses et fournir des preuves, ils ont souvent échoué à cause de subtiles erreurs, ce qui a été très frustrant pour Ghrist. Finalement, il a fait équipe avec le modèle GPT-o1-mini d'OpenAI et a réussi à percer le mystère. Ce modèle a non seulement analysé une preuve défectueuse et identifié l'erreur, mais il a également généré une « nouvelle preuve correcte et ingénieuse » en seulement 43 secondes, d'une élégance supérieure à celle des versions humaines.

LLM Lama Modèle mathématique IA

Source : Image générée par IA, fournie par Midjourney

GPT-o1-mini a excellé dans les tâches logiques, utilisant une technique de pensée en chaîne. Bien qu'il ait surpassé les modèles linguistiques traditionnels dans les tests de logique et de planification, il reste susceptible d'erreur. Ghrist résume cette expérience ainsi : « Le résultat se situe précisément à la limite de ce que les grands modèles linguistiques (LLM) peuvent prouver. » Il explique que l'identification des modes de défaillance du modèle était la clé de cette expérience.

Malgré le succès obtenu, Ghrist admet que l'utilisation de l'IA n'a pas forcément été plus rapide que de travailler seul. Il affirme même que l'article final a été meilleur grâce à l'aide de ces modèles. Son article comprend un appendice détaillant le rôle des modèles d'IA dans les résultats obtenus.

Cependant, tout ne s'est pas toujours déroulé sans accroc. Peu de temps après la publication de l'article, un autre mathématicien, Sridhar Ramesh, a fait remarquer sur les réseaux sociaux que la preuve pouvait en fait être facilement obtenue grâce à un théorème de Birkhoff, ce qui a surpris Ghrist. Il a plaisamment reconnu : « L'homme a gagné… » Cette collaboration avec l'IA, bien qu'ayant porté ses fruits, lui a également fait prendre conscience que l'intelligence humaine reste parfois la solution la plus efficace.

Actualités IA

Face-à-face intellectuel : un professeur de mathématiques et GPT o1 mini résolvent un problème en 43 secondes

AIbase基地