Der globale Markt für große Sprachmodelle wurde im letzten Monat durch die Veröffentlichung von DeepSeek in Aufruhr versetzt. Unternehmen weltweit wurden nach ihren Meinungen und Strategien zu dieser neuen Kraft gefragt. In China stehen sechs Einhorn-Startups im Bereich großer Sprachmodelle – Zero One, Baichuan Intelligent, Jieyue Xingchen, Zhipu Zhang, Yue Zhi Anmian und MiniMax – vor großen Herausforderungen, gehen aber mit unterschiedlichen Strategien an die Sache heran.
Zero Ones Gründer Li Kaifu erklärte bereits zuvor, dass sie nicht mehr die Entwicklung von Super-Sprachmodellen verfolgen, sondern sich auf leichtgewichtige Modelle konzentrieren. Am 14. Februar gründeten Zero One und der Suzhou High-Tech District gemeinsam eine Industrielle Basis für große Sprachmodelle, die sich auf die Bereiche Fertigung, Finanzen und Medizin konzentriert und darauf abzielt, die Technologie aus dem Labor in die praktische Anwendung zu bringen.
Bildquelle: Das Bild wurde mit KI generiert, Bildrechte liegen bei Midjourney.
Nur wenige Tage nach der Veröffentlichung von DeepSeek brachte Baichuan Intelligent das All-Szenario-Inferenz-Sprachmodell Baichuan-M1-preview heraus, das über Fähigkeiten in den Bereichen Sprache, Vision und Suche verfügt. Der Schwerpunkt liegt dabei auf der Transformation in den Gesundheitssektor mit dem Projekt „KI-Kinderarzt“, was eine schnelle Umsetzung in der Praxis zeigt.
Jieyue Xingchen entschied sich, am selben Tag wie DeepSeek zwei neue Modelle auf den Markt zu bringen, um seine Wettbewerbsfähigkeit zu stärken. Darüber hinaus wurde die Anwendung „Yuewen“ um neue Funktionen erweitert, um Nutzern die Anwendungsentwicklung ohne Code zu ermöglichen und das Nutzererlebnis zu verbessern.
Der Gründer von Zhipu Zhang, Tang Jie, betonte auf einem internationalen Gipfel, dass zukünftige große Sprachmodelle zum Kern des täglichen Lebens und der Arbeit werden und komplexe Aufgaben durch selbstständiges Lernen und Zusammenarbeit mit Menschen erledigen werden. Dies zeigt seine Zukunftsvision.
Yue Zhi Anmian brachte kurz nach der Veröffentlichung von DeepSeek das multimodale Denkmodell Kimi k1.5 heraus, um das Kontextverständnis und die Strategieoptimierung des Modells zu verbessern und seine kontinuierlichen Bemühungen in der technischen Innovation zu demonstrieren.
Obwohl die sechs Startups nicht direkt auf DeepSeek reagiert haben, zeigen ihre konkreten Aktionen und Produktinnovationen eine aktive Reaktion auf diesen Schock und ihre Fähigkeit, sich an Marktveränderungen anzupassen.