Durant un week-end et demi, l'influence de DeepSeek n'a cessé de croître, marquant plusieurs avancées importantes. La plateforme nationale de supercalcul haute performance a officiellement lancé DeepSeek-R1, une version prenant en charge des fonctionnalités complètes jusqu'à 671 milliards de paramètres. De plus, la puce XuanTie de Pingtouge s'est avérée compatible avec les modèles distillés de la série DeepSeek-R1, élargissant ainsi son champ d'application aux processeurs CPU basés sur l'architecture RISC-V et aux plateformes de calcul en périphérie.

Pendant le Nouvel An lunaire chinois, les trois principaux opérateurs de télécommunications ont pleinement intégré DeepSeek, marquant ainsi une expansion de son utilisation au-delà des secteurs de l'IA et d'Internet, vers une pénétration industrielle plus profonde. Cela signifie que les utilisateurs et les développeurs n'auront plus à se soucier des problèmes de « serveur occupé » lors de l'utilisation de DeepSeek, bénéficiant ainsi d'une expérience plus efficace.

DeepSeek

Source : Image générée par IA, fournie par Midjourney

Avec la popularité croissante de DeepSeek, de nombreux fournisseurs de services cloud ont saisi l'opportunité et ont baissé leurs prix. Tencent Cloud a été le premier à proposer DeepSeek avec recherche en ligne, intégrant simultanément son moteur de recherche Sogou, fournissant une API de recherche améliorée et prenant en charge l'intégration de bases de connaissances privées. Les utilisateurs peuvent ainsi intégrer leurs bases de connaissances en un seul clic. Simultanément, SenseTime et Alibaba Cloud ont suivi le mouvement : la plateforme SenseTime a offert 10 millions de jetons gratuits pendant trois mois, tandis qu'Alibaba Cloud a proposé 1 million de jetons gratuits aux nouveaux utilisateurs. Les modèles distillés sont également proposés à des prix plus abordables.

Dans le domaine des puces, les grandes entreprises accélèrent la course à la conquête du marché. La carte graphique MI300X d'AMD a triplé la vitesse d'application de DeepSeek-R1 et un Docker image officiel a été lancé. En plus de l'écosystème CUDA de NVIDIA, ROCm d'AMD offre aux utilisateurs une nouvelle alternative. Des nouvelles puces d'inférence IA telles que Groq, Cerebras et Sambanova ont même poussé la vitesse d'inférence de DeepSeek-R1-Distill Llama-70B à 500 à 1500 jetons par seconde, rendant le temps d'attente pratiquement imperceptible pour les utilisateurs.

Une autre nouvelle intéressante : le nom de domaine ai.com a été redirigé vers le site Web officiel de DeepSeek. Il se murmure que DeepSeek aurait acquis ce nom de domaine à un prix élevé. Il est à noter que ce nom de domaine a appartenu successivement à ChatGPT et xAI. À l'avenir, l'image de marque de DeepSeek sera encore plus forte.