Noam Brown, responsable de la recherche sur le raisonnement de l'intelligence artificielle chez OpenAI, a déclaré lors d'une table ronde à la conférence GTC de Nvidia que certaines formes de modèles d'IA de « raisonnement » auraient pu voir le jour 20 ans plus tôt si les chercheurs avaient « connu les bonnes méthodes et les bons algorithmes ». Il a souligné que plusieurs raisons expliquent pourquoi ce domaine de recherche a été négligé.

OpenAI

Brown a évoqué son expérience de recherche sur l'IA de jeu à l'université Carnegie Mellon, notamment Pluribus, qui a battu des joueurs de poker professionnels de haut niveau. Il a expliqué que l'IA qu'il a contribué à créer se distinguait par sa capacité à « raisonner » pour résoudre des problèmes, au lieu de se fier uniquement à la puissance brute de calcul. Brown a mentionné que le temps de réflexion des humains face à des situations complexes pourrait être très bénéfique pour l'intelligence artificielle.

Brown est également l'un des architectes du modèle d'IA o1 d'OpenAI. Ce modèle utilise une technique appelée « raisonnement au moment des tests », qui lui permet de « réfléchir » avant de répondre aux requêtes. Le raisonnement au moment des tests introduit une forme de « raisonnement » en appliquant des calculs supplémentaires au modèle en cours d'exécution. En général, les modèles de raisonnement sont plus précis et plus fiables que les modèles traditionnels, notamment dans les domaines des mathématiques et des sciences.

Lors de la table ronde, lorsqu'on lui a demandé s'il était encore possible pour le monde universitaire de mener des expériences de l'ampleur d'OpenAI, étant donné le manque général de ressources informatiques dans les universités, Brown a admis que cela était devenu plus difficile ces dernières années, car les modèles exigent de plus en plus de ressources informatiques. Cependant, il a également souligné que le monde universitaire pouvait jouer un rôle important en explorant des domaines moins exigeants en calcul, comme la conception de l'architecture des modèles.

Brown a insisté sur les possibilités de collaboration entre les laboratoires de pointe et le monde universitaire. Il a indiqué que les laboratoires de pointe se réfèrent aux publications universitaires et évaluent attentivement si les arguments présentés sont suffisamment convaincants, c'est-à-dire si la recherche serait très efficace si elle était mise à plus grande échelle. Si les arguments d'un article sont convaincants, ces laboratoires approfondiront la recherche.

En outre, Brown a particulièrement mentionné le domaine des tests de référence de l'IA, estimant que le monde universitaire pouvait y jouer un rôle important. Il a critiqué l'état actuel des tests de référence de l'IA, qu'il juge « très mauvais », soulignant que ces tests évaluent souvent des connaissances ésotériques dont la corrélation avec les compétences dans les tâches qui intéressent la plupart des gens est faible, ce qui conduit à une mauvaise compréhension des capacités et des améliorations des modèles. Brown estime que l'amélioration des tests de référence de l'IA ne nécessite pas de grandes ressources informatiques.

Il est important de noter que dans cette discussion, les premières remarques de Brown portaient sur ses travaux de recherche sur l'IA de jeu, tels que Pluribus, avant de rejoindre OpenAI, et non sur des modèles de raisonnement tels que o1.

Points clés :

  • 🤔 Noam Brown d'OpenAI estime que si la bonne méthode avait été découverte plus tôt, l'IA de « raisonnement » aurait pu voir le jour 20 ans plus tôt, et que le domaine de recherche a été négligé.
  • 🤝 Brown souligne les possibilités de collaboration entre le monde universitaire et les laboratoires d'IA de pointe, le monde universitaire pouvant jouer un rôle important dans des domaines à faible besoin de calcul, tels que la conception de l'architecture des modèles et les tests de référence de l'IA.
  • 📈 Les modèles de raisonnement utilisant des techniques comme le « raisonnement au moment des tests » sont plus précis et fiables que les modèles traditionnels, notamment dans les domaines des mathématiques et des sciences.