L'application de DeepSeek, une entreprise chinoise de modèles linguistiques de grande taille, a atteint le sommet du classement des applications gratuites sur l'App Store en Chine et aux États-Unis, surpassant ChatGPT.
Ce succès a non seulement attiré l'attention du marché, mais a également eu un impact significatif sur le cours de l'action de Nvidia, leader des puces IA. Malgré cela, un porte-parole de Nvidia a fait l'éloge de DeepSeek, le qualifiant de progrès remarquable dans le domaine de l'IA, et a souligné comment DeepSeek a utilisé la technique de mise à l'échelle du temps d'exécution, des modèles largement disponibles et des ressources de calcul conformes aux réglementations d'exportation pour créer son nouveau modèle.
Le porte-parole de Nvidia a ajouté que le processus d'inférence nécessite un grand nombre de GPU Nvidia et un réseau haute performance. Nvidia maîtrise actuellement trois lois d'extension : le pré-entraînement et le post-entraînement continus, ainsi que la nouvelle technique de mise à l'échelle du temps d'exécution. Cette déclaration signifie également que les GPU utilisés par DeepSeek sont entièrement conformes aux réglementations américaines sur les exportations.
La technique de mise à l'échelle du temps d'exécution est un sujet de discussion récurrent ces dernières années. Elle indique que si un modèle d'IA ayant terminé son entraînement complet utilise davantage de ressources de calcul pour l'inférence lors de la prédiction ou de la génération de texte ou d'images, le modèle produira des réponses de meilleure qualité. Cette technique a été appliquée à des modèles tels que o1 d'OpenAI.
Le 27 janvier, les trois principaux indices boursiers américains ont terminé la séance en ordre dispersé. Le cours de l'action Nvidia a plongé de 16,86 %, clôturant à 118,58 $ par action, son plus bas niveau en 10 mois. La capitalisation boursière de Nvidia, de 2,90 billions de dollars, a perdu 590 milliards de dollars en une seule journée, établissant un nouveau record de la plus forte baisse quotidienne de la capitalisation boursière d'une action.
Cette chute a également entraîné une forte baisse de la fortune de son fondateur, Jensen Huang, de 21 milliards de dollars.
Sous l'impulsion de Nvidia, le secteur des semi-conducteurs américains a subi un coup dur. DeepSeek, filiale de la société de quantification géante Huafu Quantification, a officiellement lancé son modèle d'inférence DeepSeek-R1 le 20 janvier. R1 a suscité un vif intérêt grâce à ses performances exceptionnelles, sa nature open source, et la baisse significative de son prix et de ses coûts de formation. Les frais de pré-entraînement de R1 ne s'élèvent qu'à 5,576 millions de dollars, et son entraînement a été réalisé en 55 jours sur un cluster de 2048 GPU Nvidia H800.
Points clés :
📈 L'application DeepSeek arrive en tête du classement des applications gratuites sur l'App Store en Chine et aux États-Unis.
💬 Nvidia qualifie DeepSeek de progrès remarquable dans le domaine de l'IA, et souligne que l'inférence nécessite de nombreux GPU.
💸 Le cours de l'action Nvidia chute de 16,86 %, entraînant une perte de 590 milliards de dollars en une seule journée, un record historique.