OpenAI annonce aujourd'hui le lancement de son nouveau modèle phare, GPT-4o mini, désormais disponible sur Azure AI. Ce modèle prend en charge le traitement de texte et intégrera prochainement des fonctionnalités pour les images, l'audio et la vidéo.

image.png

GPT-4o mini est significativement plus intelligent que GPT-3.5 Turbo : il obtient un score de 82 % au test MMLU (compréhension du langage à plusieurs tâches à grande échelle), contre 70 % pour GPT-3.5 Turbo, et il est plus de 60 % moins cher.1 Ce modèle offre une fenêtre contextuelle étendue de 128 K et intègre les améliorations multilingues de GPT-4o. GPT-4o mini est disponible gratuitement en essai sur Azure OpenAI Studio Playground.

Microsoft Azure AI assure la sécurité par défaut pour GPT-4o mini, ainsi qu'une meilleure résilience des données et une disponibilité accrue du service. Les clients peuvent s'attendre à des performances et des fonctionnalités améliorées sur Azure AI, particulièrement pour les scénarios en streaming tels que les assistants, les interpréteurs de code et la recherche.

Azure AI annonce une option de déploiement mondial à la demande et à haut débit pour GPT-4o mini. Désormais, les clients peuvent payer en fonction des ressources consommées, tandis que le trafic est routé globalement pour un débit accru, tout en maintenant un contrôle statique sur l'emplacement de stockage des données. L'option de déploiement mondial à la demande offrira un débit de 15 millions de jetons par minute (TPM), une disponibilité de 99,99 % pour GPT-4o mini, et les mêmes tarifs que ceux d'OpenAI.

GPT-4o mini sera disponible sur Azure AI ce mois-ci et sera proposé dans le cadre du service Batch. Batch permet de traiter des tâches à fort débit en 24 heures avec une réduction de 50 % grâce à l'utilisation des capacités hors pointe. Ceci n'est possible que grâce à l'infrastructure de Microsoft sur Azure AI, permettant ainsi à Microsoft Azure AI de proposer des capacités hors pointe à ses clients.

Microsoft Azure AI lancera également ce mois-ci la fonctionnalité d'ajustement fin de GPT-4o mini, permettant aux clients de personnaliser davantage le modèle en fonction de leurs cas d'utilisation et scénarios spécifiques. Suite à la mise à jour du mois dernier concernant la facturation basée sur les jetons pour la formation, Microsoft Azure AI a réduit les frais de gestion de 43 %. Couplé à son prix d'inférence abordable, cela fait des déploiements d'ajustement fin du service Azure OpenAI le produit le plus rentable pour les clients ayant des charges de travail de production.

Points clés :

⭐ GPT-4o mini arrive sur Azure AI, avec prise en charge du traitement de texte, une vitesse exceptionnelle et des fonctionnalités complètes.

⭐ Ce nouveau modèle est plus intelligent que ses prédécesseurs, plus de 60 % moins cher, et offre une fenêtre contextuelle plus large ainsi que des fonctionnalités multilingues.

⭐ Azure AI propose une option de déploiement mondial à la demande pour GPT-4o mini, garantissant un débit élevé et une disponibilité de 99,99 %.