Récemment, l'équipe du Sky Computing Lab de l'Université de Californie à Berkeley a publié Sky-T1-32B-Preview, un modèle d'intelligence artificielle inférentiel open source, rendant la recherche et le développement de l'IA inférentielle plus faciles et moins coûteux. Ce modèle a excellé dans plusieurs benchmarks clés, rivalisant même avec les versions antérieures du modèle o1 d'OpenAI.

Le coût d'entraînement de Sky-T1 est remarquablement bas, seulement 450 $, ce qui signifie que la réplication de capacités inférentielles de haut niveau est devenue plus abordable et efficace. Bien que 450 $ puissent sembler élevés, c'est une énorme réduction par rapport aux coûts de plusieurs millions de dollars d'il y a quelques années. L'utilisation de données d'entraînement synthétiques, c'est-à-dire des données générées par d'autres modèles, a permis de réduire considérablement les coûts. Le modèle Palmyra X004 récemment publié par la société d'IA Writer, repose presque entièrement sur des données synthétiques et son développement n'a coûté que 700 000 $.

Cerveau, grand modèle, IA

Source : Image générée par IA, fournisseur de services d'autorisation d'images : Midjourney

Contrairement à la plupart des IA, les modèles inférentiels peuvent efficacement s'auto-vérifier, ce qui les rend plus fiables pour traiter certains problèmes courants. Les modèles inférentiels prennent généralement plus de temps pour trouver des solutions, allant de quelques secondes à quelques minutes, mais leur fiabilité est un atout majeur dans des domaines tels que la physique, les sciences et les mathématiques.

L'équipe NovaSky a utilisé un autre modèle inférentiel, le QwQ-32B-Preview d'Alibaba, pour générer les données d'entraînement initiales de Sky-T1, a « curé » ces données, puis a utilisé GPT-4o-mini d'OpenAI pour les restructurer dans un format plus utilisable. L'entraînement de Sky-T1, avec ses 3,2 milliards de paramètres, n'a pris qu'environ 19 heures, en utilisant un ensemble de 8 GPU Nvidia H100. Le nombre de paramètres est approximativement corrélé à la capacité du modèle à résoudre des problèmes.

Selon l'équipe NovaSky, Sky-T1 a surpassé les versions préliminaires de o1 sur MATH500, un ensemble de défis mathématiques de « niveau compétition ». De plus, Sky-T1 a également surpassé les versions préliminaires de o1 sur les problèmes difficiles rencontrés dans LiveCodeBench. Cependant, sur les problèmes de physique, de biologie et de chimie, Sky-T1 a été moins performant que la version préliminaire de o1 dans le test GPQA-Diamond.

Il est important de noter que la version GA d'OpenAI, o1, est plus puissante que la version préliminaire, et OpenAI prévoit de publier une version encore meilleure, o3, dans les prochaines semaines. Cependant, l'équipe NovaSky affirme que Sky-T1 n'est que le début de leur voyage pour développer des modèles open source dotés de capacités inférentielles avancées.

« À l'avenir, nous nous concentrerons sur le développement de modèles plus efficaces pour maintenir de fortes performances inférentielles, et explorerons des techniques avancées pour améliorer encore l'efficacité et la précision des modèles », a écrit l'équipe sur son blog. « Restez à l'écoute pour suivre nos progrès sur ces projets passionnants. »