Microsoft a annoncé l'arrivée d'un nouveau membre de sa famille de modèles d'IA générative Phi : Phi-4. Par rapport aux versions précédentes, Phi-4 présente plusieurs améliorations, notamment une capacité remarquable à résoudre des problèmes mathématiques, grâce à une meilleure qualité des données d'entraînement.

Jusqu'à jeudi soir, l'accès à Phi-4 était relativement limité, disponible uniquement sur la nouvelle plateforme de développement Azure AI Foundry de Microsoft, et réservé à des fins de recherche dans le cadre d'un accord de licence de recherche Microsoft.

Cerveau d'intelligence artificielle, grand modèle

Source : Image générée par IA, fournisseur de services d'autorisation d'images Midjourney

Phi-4 est le dernier modèle linguistique de petite taille lancé par Microsoft, avec 14 milliards de paramètres. Comparable à d'autres modèles de petite taille tels que GPT-4o mini, Gemini 2.0 Flash et Claude 3.5 Haiku, ces modèles se caractérisent généralement par une vitesse d'exécution plus rapide et un coût inférieur. De plus, les performances des modèles linguistiques de petite taille n'ont cessé de s'améliorer ces dernières années.

Microsoft attribue l'amélioration des performances de Phi-4 à l'utilisation d'un « ensemble de données synthétiques de haute qualité » et d'un ensemble de données de haute qualité provenant de contenu généré par l'homme, ainsi qu'à des améliorations post-entraînement non divulguées.

De nombreux laboratoires d'intelligence artificielle suivent de près le potentiel des données synthétiques et de l'entraînement postérieur pour améliorer les performances des modèles. Alexandr Wang, PDG de Scale AI, a mentionné dans un tweet jeudi : « Nous avons atteint le goulot d'étranglement des données d'entraînement préalables. » Cette déclaration confirme également certains rapports récents sur ce sujet.

Il est également important de noter que Phi-4 est le premier modèle de la série Phi lancé après le départ du vice-président de l'IA de Microsoft, Sébastien Bubeck. Bubeck a joué un rôle important dans le domaine de l'IA chez Microsoft et a été un acteur clé du développement des modèles Phi. Bubeck a quitté Microsoft en octobre pour rejoindre OpenAI.