Coût exorbitant des tests de référence des modèles d'IA déductifs : près de 3 000 $ pour une évaluation

AIbase基地

Publié leActualités IA · 4 minutes de lecture · Apr 11, 2025

Selon les données d'Artificial Analysis, un organisme tiers d'évaluation de l'IA, l'évaluation du modèle de raisonnement o1 d'OpenAI sur sept benchmarks populaires coûte 2 767,05 dollars, tandis que son modèle non-raisonnement GPT-4o ne coûte que 108,85 dollars. Cette différence significative a suscité un débat sur la durabilité et la transparence de l'évaluation de l'IA.

Les modèles de raisonnement, c'est-à-dire les systèmes d'IA capables de « penser » progressivement à la solution d'un problème, bien qu'excellents dans des domaines spécifiques, ont un coût d'évaluation de référence bien supérieur à celui des modèles traditionnels. Artificial Analysis estime qu'une douzaine de modèles de raisonnement ont coûté au total 5 200 dollars, soit près du double du coût de l'analyse de plus de 80 modèles non-raisonnement (2 400 dollars).

Robot Intelligence artificielle IA

Source : Image générée par IA, fournisseur de services d'autorisation d'images : Midjourney

La différence de coût provient principalement de la grande quantité de jetons générés par les modèles de raisonnement. Par exemple, o1 a généré plus de 44 millions de jetons lors des tests, soit environ huit fois plus que GPT-4o. Avec des benchmarks de plus en plus complexes, capables d'évaluer les capacités pour des tâches du monde réel, et la hausse du coût par jeton des modèles haut de gamme (par exemple, o1-pro d'OpenAI facture 600 dollars par million de jetons de sortie), la validation indépendante des performances de ces modèles devient extrêmement coûteuse.

Bien que certains laboratoires d'IA fournissent un accès gratuit ou subventionné aux organismes de référence, les experts craignent que cela puisse nuire à l'objectivité de l'évaluation. Ross Taylor, PDG de General Reasoning, s'interroge : « D'un point de vue scientifique, si vous publiez un résultat que personne ne peut reproduire avec le même modèle, peut-on encore parler de science ? »

modèles déductifs GPT-4 coût évaluation IA Midjourney

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

Bulletin IA : OpenAI publie trois nouveaux modèles vocaux ; la recherche Kuaishou intègre pleinement DeepSeek R1 ; Claude lance une fonction de recherche en ligne

Bienvenue dans la rubrique « Bulletin IA » ! Votre guide quotidien pour explorer le monde de l’intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du secteur de l’IA, en nous concentrant sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits IA. Découvrez les nouveaux produits IA : https://top.aibase.com/1. OpenAI lance gpt-4o-transcribe, un nouveau modèle de transcription vocale, qui améliore considérablement la précision de la transcription vocale en texte

Mar 21, 2025

OpenAI lance gpt-4o-transcribe, un nouveau modèle de transcription vocale avec une précision accrue

Après avoir suscité un certain intérêt dans le domaine de l'IA vocale, OpenAI, le créateur de ChatGPT, poursuit ses efforts et lance trois nouveaux modèles vocaux développés en interne : gpt-4o-transcribe, gpt-4o-mini-transcribe et gpt-4o-mini-tts. Le plus remarquable est gpt-4o-transcribe. Ces nouveaux modèles sont actuellement...

Mar 21, 2025

OpenAI lance GPT-4O-Audio-Preview : la voix peut désormais "comprendre" les émotions !

OpenAI révolutionne une fois de plus le secteur de l'intelligence artificielle avec le lancement de son nouveau modèle gpt-4o-audio-preview. Ce modèle fait preuve de capacités étonnantes en matière de génération et d'analyse vocale, ouvrant de nouvelles perspectives pour l'interaction homme-machine. Découvrons ensemble les caractéristiques et les applications potentielles de ce modèle innovant. Les fonctionnalités principales de gpt-4o-audio-preview se répartissent en trois axes : premièrement, il est capable de générer des réponses vocales naturelles et fluides à partir de texte, ce qui est idéal pour les assistants vocaux et les services clients virtuels.

Oct 18, 2024

7.6k

Nouveau modèle OpenAI gpt-4o-2024-08-06 et gpt-4o-mini prennent en charge la sortie structurée

OpenAI a ajouté une fonctionnalité de sortie structurée à son API, garantissant que la sortie générée est parfaitement conforme à la structure JSON prédéfinie, améliorant ainsi considérablement la fiabilité de l'API et la précision des applications. Cette fonctionnalité définit non seulement la structure du JSON, mais garantit également l'exactitude de la sortie. Simultanément, les prix ont été réduits : le coût d'entrée a été diminué de moitié et le coût de sortie de 1/3. L'introduction de la sortie structurée a résolu les limitations du schéma JSON en matière de garantie de conformité de la sortie à une structure spécifique, améliorant considérablement les performances du modèle en matière de sortie structurée. Grâce à des innovations techniques, telles que la limitation...

Aug 7, 2024

8.0k

OpenAI lance le nouveau modèle gpt-4o-64k-output-alpha : l'API GPT-4o prend désormais en charge des sorties jusqu'à 64K

Le point fort du nouveau modèle gpt-4o-64k-output-alpha d'OpenAI est sa capacité à générer des sorties jusqu'à 64K tokens en une seule fois. Idéal pour créer du contenu riche et détaillé, il répond aux besoins de la rédaction, de la programmation et de l'analyse de données complexes. Cependant, cette fonctionnalité augmente le prix de l'API : 18 $ par million de tokens en sortie, contre 6 $ par million de tokens en entrée. Cette mesure vise à compenser les coûts de calcul élevés et à encourager une utilisation responsable de cet outil puissant. Ce modèle est une avancée majeure pour les domaines de la création et de la recherche.

Jul 31, 2024

3.5k

Tutoriel d'invite : Comment créer des photos réalistes d'iPhone avec Midjourney

La capacité de Midjourney à générer des images est impressionnante, comme le savent tous ceux qui l'ont déjà utilisé. Cependant, en tant que leader dans le domaine de l'art IA, Midjourney peut parfois produire des images manquant de réalisme. Même si les images générées sont belles, elles peuvent avoir un aspect un peu « faux ». Exemple de test AIbase : iPhonephotoofwithmanyraisinsontop.Ataafancyrestaurantinnyc.--ar3:4--stylera

Jul 18, 2024

1.3k

Une blogueuse Little Red Book publie des illustrations IA apaisantes et attire un nombre fou d'abonnés

Jul 17, 2024

210

Actualités IA

IA Quotidien

Chronologie de l'IA

Derniers cas

Collection d'images

Collection de vidéos

Collection audio

Collection de contenu

Derniers tutoriels

Classement des produits IA

Classement de la croissance du trafic IA

Classement de la baisse du trafic IA

Classement hebdomadaire de l'IA

États-Unis

Chine

Inde

Brésil

Génération d'images

Assistant personnel

Génération de personnages

Génération de vidéos

Classement des projets IA

Classement de la croissance des projets IA

Classement des développeurs IA

Classement des organisations IA

Deepseek

TTS

LLM

ChatGPT

Aperçu