Récemment, OpenAI a publié une étude sur son dernier modèle d'inférence, o3, démontrant comment les grands modèles de langage (LLM) peuvent évoluer de programmeurs débutants à des concurrents de niveau mondial. o3 a obtenu un score de 2724 sur la célèbre plateforme de programmation CodeForces, se situant dans le 99,8e centile, une performance remarquable, et a remporté une médaille d'or à l'Olympiade Internationale d'Informatique (IOI) 2024.
Source : Image générée par IA, fournisseur de services d'autorisation d'images Midjourney
L'étude montre que le modèle o3 a surpassé le modèle o1-ioi, spécialement optimisé pour l'IOI, ce qui suggère que les résultats obtenus grâce à l'apprentissage par renforcement sont supérieurs aux solutions conçues manuellement. Lors de l'IOI 2024, o3 a participé à la compétition dans des conditions standard et a franchi avec succès le seuil de la médaille d'or. Simultanément, il s'est classé parmi les 200 meilleurs programmeurs mondiaux sur CodeForces, rivalisant avec les meilleurs programmeurs humains.
Ethan Mollick, professeur adjoint à la Wharton School, a déclaré : « Les capacités d'inférence générales développées grâce à l'apprentissage par renforcement dépassent désormais les solutions spécifiques à un domaine soigneusement conçues. Au lieu de construire des systèmes spécialisés pour des tâches spécifiques, il est préférable d'obtenir de meilleurs résultats grâce à des capacités d'inférence plus puissantes dans les grands modèles généralistes. »
Cette étude fait partie de l'évaluation par OpenAI des performances de ses modèles en programmation compétitive et dans le domaine plus large de l'ingénierie logicielle. Par ailleurs, Anthropic a publié lundi un rapport sur l'impact de l'IA sur le monde du travail. Le rapport indique qu'environ 36 % des professions utilisent l'IA pour au moins 25 % de leurs tâches, 57 % des applications d'IA améliorant les capacités humaines et 43 % se concentrant sur l'automatisation. Cependant, seulement 4 % des professions utilisent l'IA pour au moins 75 % de leurs tâches.
L'étude montre également que le développement de logiciels et la rédaction technique sont les principaux domaines d'application de l'IA, tandis que son rôle est relativement moindre dans les tâches impliquant une interaction physique avec l'environnement.
Points clés :
💻 Le modèle o3 a obtenu un score de 2724 sur CodeForces, se situant dans le 99,8e centile, et a remporté une médaille d'or à l'Olympiade Internationale d'Informatique.
📊 L'apprentissage par renforcement surpasse les solutions traditionnelles conçues manuellement, démontrant l'avantage des capacités d'inférence générales.
📈 L'IA est largement utilisée sur le marché du travail, le développement de logiciels et la rédaction technique étant ses principaux domaines d'application, mais son utilisation est moindre dans les tâches d'interaction physique.