Le dernier modèle o1 d'OpenAI a fait des vagues dans le domaine de l'IA. Ce modèle, autrefois surnommé "fraise" en interne par l'entreprise, offre aux utilisateurs de ChatGPT une nouvelle opportunité de vivre le processus de "réflexion" de l'IA. Cependant, ce modèle tant attendu mérite-t-il vraiment d'être essayé ? La réponse semble être : un mélange de bon et de mauvais.
Le modèle o1 a effectivement montré des progrès significatifs dans certains domaines. Ses performances en matière de raisonnement et de résolution de problèmes complexes sont impressionnantes, notamment sa capacité de "raisonnement en plusieurs étapes". Cette capacité permet au modèle de "réfléchir" avant de répondre à une question, de décomposer les grands problèmes en petites étapes et d'essayer d'identifier la justesse de chaque étape. Cette méthode n'est pas un concept nouveau, mais la mise en œuvre d'o1 en fait une technologie viable.
Cependant, le modèle o1 présente également des défauts évidents. Comparé à GPT-4o, o1 est moins performant en termes d'utilisation d'outils, de capacités multimodales et de vitesse de traitement. Plus important encore, le coût d'utilisation d'o1 est environ quatre fois supérieur à celui de GPT-4o, ce qui affectera sans aucun doute son adoption généralisée. OpenAI a même admis que, pour la plupart des tâches quotidiennes, GPT-4o reste le meilleur choix.
Le modèle o1 a démontré sa valeur unique dans des applications concrètes. Par exemple, pour des tâches complexes comme la planification d'un dîner de Thanksgiving, o1 peut fournir des conseils détaillés et réfléchis, en tenant compte de plusieurs facteurs tels que la gestion du four et le contrôle des coûts. Cependant, pour les problèmes simples, o1 semble "trop réfléchir", donnant des réponses longues et inutiles.
Les avis des experts du secteur sur le modèle o1 sont partagés. Ravid Shwartz Ziv, professeur de recherche sur les modèles d'IA à l'Université de New York, estime que, bien qu'o1 soit impressionnant, l'amélioration globale n'est pas significative. Rohan Pandey, ingénieur de recherche chez ReWorkd, déclare que la capacité de raisonnement d'o1, bien que puissante, ne représente pas une avancée révolutionnaire.
La stratégie de tarification d'o1 a également suscité des discussions. En plus des frais habituels d'entrée/sortie, les utilisateurs doivent payer des frais supplémentaires de "jetons de raisonnement" pour le "processus de réflexion" du modèle. Ce modèle de tarification souligne la nécessité d'utiliser o1 avec prudence afin d'éviter des coûts excessifs pour des problèmes simples.
Malgré ces limitations, le modèle o1 démontre le potentiel de l'IA en matière de raisonnement complexe. Il pourrait devenir un outil puissant pour aider les utilisateurs à examiner les décisions importantes, en particulier dans les scénarios nécessitant une analyse approfondie et une prise en compte multidimensionnelle. Cependant, la question de savoir si o1 vaut son prix élevé reste à débattre.
Sam Altman, PDG d'OpenAI, a également tempéré les attentes excessives du public, soulignant qu'o1 n'est pas une intelligence artificielle générale et qu'il présente encore de nombreux défauts et limitations. Cette attitude franche reflète également la perception rationnelle du progrès technologique dans l'industrie de l'IA.