Récemment, Sam Altman, PDG d'OpenAI, a annoncé sur la plateforme X que le lancement du dernier modèle, GPT-4.5, serait échelonné en raison d'une pénurie de ressources GPU. Altman a expliqué que GPT-4.5 est un modèle d'une ampleur et d'un coût considérables, nécessitant « des milliers » de GPU pour prendre en charge un plus grand nombre d'utilisateurs ChatGPT.

QQ_1740704579725.png

GPT-4.5 sera d'abord accessible aux abonnés ChatGPT Pro, dès ce jeudi. Les utilisateurs ChatGPT Plus y auront accès la semaine suivante. Cette stratégie de déploiement progressif vise à gérer la pénurie actuelle de ressources GPU et à garantir une expérience utilisateur progressive avec ce modèle d'intelligence artificielle avancé.

Altman a également révélé que la complexité de GPT-4.5 entraîne des coûts d'utilisation très élevés. OpenAI facturera 75 $ pour chaque million de jetons (environ 750 000 mots) entrés et 150 $ pour chaque million de jetons sortis. Ces tarifs représentent respectivement 30 et 15 fois le coût d'entrée et de sortie de GPT-4o, le produit phare précédent d'OpenAI. Cette politique tarifaire a suscité de nombreuses réactions et discussions parmi les utilisateurs, qui la jugent excessive.

Altman a déclaré dans son communiqué : « Notre croissance est extrêmement rapide et nous avons épuisé nos ressources GPU. Nous prévoyons d'ajouter des milliers de GPU la semaine prochaine et de déployer ensuite le modèle auprès des utilisateurs Plus. Ce n'est pas le mode de fonctionnement que nous souhaitions, mais il est difficile de prédire avec précision les pics de croissance qui entraînent des pénuries de GPU. » Il a également mentionné qu'OpenAI était confronté à un manque de capacité de calcul et qu'il prévoyait de développer ses propres puces IA et de construire de grands centres de données pour relever ce défi.

Points clés :

🌐 Le PDG d'OpenAI, Sam Altman, a annoncé que le lancement de GPT-4.5 serait échelonné en raison d'une pénurie de ressources GPU.

💰 L'utilisation de GPT-4.5 est extrêmement coûteuse, les frais d'entrée et de sortie étant respectivement 30 et 15 fois supérieurs à ceux de GPT-4o.

🔧 OpenAI prévoit de résoudre le problème de manque de capacité de calcul en développant ses propres puces IA et en construisant de grands centres de données.