Le marché mondial des grands modèles a été bouleversé par le lancement de DeepSeek le mois dernier, obligeant les grandes entreprises à se prononcer sur cette nouvelle force et à définir leurs stratégies de réponse. En Chine, les six start-ups spécialisées dans les grands modèles, déjà devenues des licornes – Zero One, Baichuan Intelligent, Jieyue Xingchen, Zhipu Zhang, Yue Zhi Anmian et MiniMax – font face à des défis de taille, mais leurs stratégies de réaction divergent.
Tout d’abord, Li Kaifu, fondateur de Zero One, a déclaré qu’ils ne cherchaient plus à entraîner des modèles surpuissants, mais se concentraient sur le développement de modèles légers. Le 14 février, Zero One et la zone de haute technologie de Suzhou ont créé conjointement une base industrielle de grands modèles, axée sur les secteurs manufacturier, financier et médical, afin de concrétiser les applications pratiques de cette technologie.
Source : Image générée par IA, fournie par Midjourney
Quelques jours seulement après le lancement de DeepSeek, Baichuan Intelligent a présenté Baichuan-M1-preview, un grand modèle de raisonnement omnicanal, doté de capacités linguistiques, visuelles et de recherche. L’entreprise se concentre sur le secteur médical avec le projet « AI pédiatre », démontrant une mise en œuvre rapide sur le terrain.
Jieyue Xingchen a quant à lui lancé deux nouveaux modèles le jour même de la sortie de DeepSeek, renforçant ainsi sa compétitivité. Son application « Yuewen » a également bénéficié de nouvelles fonctionnalités pour permettre aux utilisateurs de développer des applications sans code, améliorant ainsi l’expérience utilisateur.
Tang Jie, fondateur de Zhipu Zhang, a souligné lors d’un sommet international que les futurs grands modèles linguistiques seraient au cœur de la vie quotidienne et du travail, accomplissant des tâches complexes grâce à l’apprentissage autonome et à la collaboration humaine, témoignant ainsi de sa vision prospective.
Yue Zhi Anmian a, peu de temps après le lancement de DeepSeek, présenté Kimi k1.5, un modèle de réflexion multimodale, améliorant la compréhension contextuelle et l’optimisation stratégique du modèle, soulignant ainsi ses efforts continus en matière d’innovation technologique.
Bien que ces six start-ups n’aient pas directement répondu à DeepSeek, leurs actions concrètes et leurs innovations produits démontrent une réaction active à ce bouleversement et une capacité d’adaptation au marché.