Récemment, DeepSeek, une société d'IA basée à Hangzhou, a publié son dernier grand modèle linguistique : le V3. Ce modèle open source a démontré des performances proches de celles de GPT-4 d'OpenAI et de Claude 3.5 Sonnet d'Anthropic lors de plusieurs tests de référence, impressionnant l'industrie. Comparé aux investissements de plusieurs centaines de millions de dollars de ses homologues américains, le coût total du modèle V3 de DeepSeek n'a été que de 5,6 millions de dollars, une différence saisissante.

Grand modèle Métavers (1)

Source de l'image : Image générée par IA, fournisseur de services d'autorisation d'images Midjourney

Liang Wenfeng, PDG de DeepSeek, a déclaré que le financement n'avait jamais été un problème pour eux. Bien que le V3 ait été entraîné sur des puces H800, l'équipe de DeepSeek a su démontrer de solides capacités de recherche et d'ingénierie malgré des ressources limitées.

Le pionnier de l'IA, Andrej Karpathy, a commenté en qualifiant le budget d'investissement de DeepSeek de « blague », mais a reconnu que les résultats obtenus étaient « une recherche et une ingénierie impressionnantes compte tenu des contraintes de ressources ».

L'AGI est considérée comme le « saint Graal » de la recherche en IA, capable de surpasser les humains dans la résolution de problèmes et l'exécution de tâches. Les experts prédisent que, une fois la technologie mature, le premier pays à réaliser l'AGI aura un énorme avantage économique, scientifique et sécuritaire.