Les fraises sont enfin là ! OpenAI lance le modèle révolutionnaire « o1 » : des capacités de raisonnement dépassant celles des humains

AIbase基地

Publié leActualités IA · 8 minutes de lecture · Sep 13, 2024

124

OpenAI a officiellement lancé jeudi son modèle linguistique IA très attendu, "o1". Ce nouveau modèle, surnommé "Strawberry", affirme présenter des améliorations significatives en matière de "raisonnement" et de résolution de problèmes par rapport aux précédents grands modèles linguistiques. La série de modèles o1 est actuellement disponible sous deux formes, o1-preview et o1-mini, et est accessible aux utilisateurs de ChatGPT Plus et à certains utilisateurs de l'API.

La caractéristique la plus remarquable d'o1 est son processus de pensée anthropomorphique. Avant de répondre à une question, o1 entre dans un mode de réflexion particulier, décomposant les problèmes complexes en plusieurs petites étapes résolues successivement, générant ainsi une longue chaîne de pensée interne pour parvenir à une réponse plus précise.

Cette technique, que Google DeepMind appelle "calcul au moment du test" (Test-time computation), repose sur l'utilisation d'un modèle de récompense de vérification intensif et orienté processus, ainsi que sur la mise à jour adaptative de la distribution de probabilité des réponses du modèle.

Points clés :
Les versions o1-preview et o1-mini ont des temps de réponse plus longs, imitant la réflexion humaine progressive ;
La série o1 est en phase de test et ne prend en charge que les fonctions textuelles. D'autres fonctionnalités telles que la connexion au Web, la création d'images et l'importation de fichiers sont en cours de développement ;
Le développement de prototypes d'API est limité à 20 requêtes par minute ;
L'API ne prend pas en charge les appels de fonctions, la sortie en continu ni les informations système.

En quoi o1 est-il performant ?

OpenAI affirme qu'o1-preview surpasse son prédécesseur, GPT-4o, dans plusieurs tests de référence, notamment en programmation compétitive, en mathématiques et en "raisonnement scientifique".

En programmation, o1-preview se classe au 89e centile des problèmes de programmation compétitive sur Codeforces.

Lors des épreuves de sélection de l'Olympiade américaine de mathématiques, les performances d'o1 sont comparables à celles des 500 meilleurs étudiants américains. Les capacités mathématiques d'o1 sont remarquables : lors de l'examen de qualification pour l'Olympiade internationale de mathématiques, o1-preview a obtenu un score de 83 %, contre seulement 13 % pour GPT-4o.

Plus étonnant encore, o1 a surpassé pour la première fois le niveau d'un doctorant humain dans des tests de référence de physique, de biologie et de chimie, marquant une avancée révolutionnaire dans les capacités de raisonnement complexe de l'IA.

Pourquoi o1 est-il si performant en raisonnement ?

Les progrès d'o1 sont principalement dus à une nouvelle méthode d'entraînement par apprentissage par renforcement. Cette méthode apprend au modèle à prendre plus de temps pour "réfléchir" avant de répondre aux questions, de manière similaire aux invites de chaîne de pensée "pensons étape par étape" utilisées dans d'autres grands modèles linguistiques. Ce processus permet à o1 d'essayer différentes stratégies et de "détecter" ses propres erreurs.

OpenAI indique qu'il continuera à développer les modèles o1 et GPT, et prévoit d'ajouter à o1-preview des fonctionnalités telles que la navigation Web, la génération d'images et le téléchargement de fichiers.

Cependant, ces données impressionnantes ne sont pas sans controverse. Certains utilisateurs ont signalé qu'o1 n'était pas supérieur à GPT-4o sur tous les indicateurs.

De plus, le traitement en plusieurs étapes effectué en arrière-plan par le modèle entraîne des temps de réponse plus longs, ce qui a suscité des critiques. Joanne Jang, chef de produit chez OpenAI, a déclaré sur les réseaux sociaux : "o1 est le premier modèle de raisonnement à exceller dans des tâches extrêmement difficiles, et il ne fera que s'améliorer. Mais ce n'est pas un 'modèle miracle' supérieur aux modèles précédents sur tous les aspects."

Il est important de noter que les tests de référence de l'IA sont notoirement peu fiables et facilement manipulables. Les capacités réelles d'o1 doivent être confirmées par des vérifications et des expériences indépendantes des utilisateurs. Début d'année, une étude du MIT a révélé que certaines déclarations de référence d'OpenAI concernant GPT-4 l'année dernière étaient erronées ou exagérées.

Au-delà de l'amélioration des performances, o1 a suscité un débat sur les capacités de "raisonnement" de l'IA. Certains experts du secteur estiment qu'il est inapproprié d'attribuer des caractéristiques humaines telles que la "réflexion" ou le "raisonnement" aux modèles d'IA.

Informations officielles : https://openai.com/index/introducing-openai-o1-preview/

Accès officiel : https://top.aibase.com/tool/openai-o1

OpenAI offre gratuitement une version allégée de Deep Research o4-mini

OpenAI a annoncé que son puissant outil de recherche IA, Deep Research, sera disponible gratuitement pour les utilisateurs avec une version allégée. Cette initiative marque une nouvelle étape importante dans la démocratisation de l'IA. En tant qu'agent IA capable de mener à bien des tâches de recherche complexes de manière autonome, la mise à disposition gratuite de Deep Research offrira aux étudiants, aux chercheurs et au grand public un accès plus facile à l'information. Points forts de Deep Research : une nouvelle expérience de recherche intelligente. Deep Research est un produit d'OpenAI lancé en...

Nouveau modèle open source DeepCoder : programmation ultra-efficace, surpassant le modèle o1 d'OpenAI

Dans le contexte de l'évolution rapide des technologies, l'intelligence artificielle (IA) ne cesse de progresser. Récemment, le nouveau modèle DeepCoder-14B-Preview, mis en open source par la célèbre plateforme d'entraînement de grands modèles Together AI et la plateforme d'agents intelligents Agentica, a suscité un vif intérêt. Avec seulement 14 milliards de paramètres, ce modèle a obtenu un score de 60,6 % sur la plateforme de test de code LiveCodeBench, surpassant le modèle o1 d'OpenAI (59,5 %), avec une légère marge.

Recrutement massif de talents en IA chez Alibaba International : 80 % des postes axés sur l'intelligence artificielle

Alibaba International a annoncé qu'il renforcerait le recrutement de talents en intelligence artificielle (IA) lors du recrutement sur les campus de 2026. Les informations sur son site Web indiquent que les postes liés à l'IA représentent 80 % des offres pour cette promotion. Ce recrutement couvre plusieurs domaines clés, notamment les algorithmes d'IA, la recherche et développement, et la gestion de produits IA. Cette initiative de recrutement est étroitement liée aux investissements continus d'Alibaba International dans le domaine de l'intelligence artificielle ces dernières années. En tant que groupe d'activités d'Alibaba spécialisé dans le commerce électronique à l'étranger, Alibaba International se distingue par son innovation technologique et a notamment lancé le premier ...

Le modèle d'inférence HunYuan-T1 de Tencent rivalise avec les capacités de o1 d'OpenAI lors de tests de référence

Tencent a récemment annoncé le lancement de son dernier grand modèle linguistique, HunYuan-T1, affirmant que ses capacités d'inférence sont comparables à celles du meilleur système d'inférence d'OpenAI. Selon Tencent, HunYuan-T1 s'appuie fortement sur l'apprentissage par renforcement lors de son développement, avec 96,7 % de sa puissance de calcul post-entraînement dédiée à l'amélioration de ses capacités de raisonnement logique et de son alignement sur les préférences humaines. Lors de plusieurs tests de référence, HunYuan-T1 a démontré des performances impressionnantes. Dans l'évaluation MMLU-PRO testant 14 disciplines, le modèle a obtenu un score de 87,2.

Bulletin IA : OpenAI lance l'API o1-pro la plus chère de son histoire ; Tencent dévoile son nouveau modèle d'inférence T1 ; le modèle vidéo Step-Video-TI2V de Jieyue Xingchen est open source

Bienvenue à la rubrique 【Bulletin IA】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en nous concentrant sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits IA. Découvrez les nouveaux produits IA : https://top.aibase.com/1. Le plus cher ! Les utilisateurs peuvent appeler l'assistant Gemini directement via l'icône de l'interface utilisateur, profiter de raccourcis clavier personnalisés et de l'icône de la barre d'état système, bien que le mode de fixation de la barre latérale ne soit pas encore pris en charge.

Responsable de la recherche chez OpenAI : certains modèles d'IA de raisonnement auraient pu voir le jour 20 ans plus tôt

Noam Brown, responsable de la recherche sur le raisonnement de l'intelligence artificielle chez OpenAI, a déclaré lors d'une table ronde à la conférence GTC de Nvidia que certaines formes de modèles d'IA de raisonnement « auraient pu voir le jour 20 ans plus tôt, si les chercheurs avaient connu les bonnes méthodes et les bons algorithmes ». Il a indiqué que plusieurs raisons expliquent pourquoi ce domaine de recherche a été négligé. Brown a évoqué son expérience de recherche sur l'IA de jeu à l'université Carnegie Mellon, notamment Pluribus, qui a battu des joueurs de poker professionnels de haut niveau. Il a déclaré qu'à l'époque, il avait contribué à créer

Le plus cher ! OpenAI lance le modèle d'IA amélioré o1-pro, son prix est dix fois supérieur à celui de o1

La société de recherche en intelligence artificielle OpenAI a récemment annoncé le lancement d'un nouveau modèle d'IA de raisonnement appelé o1-pro via son API développeur. Selon OpenAI, o1-pro a bénéficié de ressources de calcul accrues par rapport à son modèle existant o1, dans le but de fournir des réponses constamment améliorées. Cependant, ce modèle hautes performances n'est actuellement accessible qu'à certains développeurs spécifiques : ceux ayant dépensé au moins 5 $ sur les services de l'API OpenAI. Plus remarquable encore, o1-pr

Actualités IA

IA Quotidien

Chronologie de l'IA

Al hardware

Derniers cas

Collection d'images

Collection de vidéos

Collection audio

Collection de contenu

Derniers tutoriels

Classement des produits IA

Classement de la croissance du trafic IA

Classement de la baisse du trafic IA

Classement hebdomadaire de l'IA

États-Unis

Chine

Inde

Brésil

Génération d'images

Assistant personnel

Génération de personnages

Génération de vidéos

Classement des projets IA

Classement de la croissance des projets IA

Classement des développeurs IA

Classement des organisations IA

Deepseek

TTS

LLM

ChatGPT

Aperçu

Les fraises sont enfin là ! OpenAI lance le modèle révolutionnaire « o1 » : des capacités de raisonnement dépassant celles des humains

AIbase基地

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes