Kürzlich wurden die DeepSeek-Großmodelle der DeepSeek-Reihe, darunter DeepSeek-R1, V3 und Coder, offiziell in die nationale Supercomputer-Internetplattform (www.scnet.cn) integriert. Unterstützt durch die inländische, hochentwickelte, integrierte Rechenleistung und das nationale, einheitliche Rechenleistungssystem, hat die chinesische KI-Großmodellbranche einen entscheidenden Schritt nach vorne gemacht.
Die nationale Supercomputer-Internetplattform bietet derzeit die Versionen 1.5B, 7B, 8B und 14B des DeepSeek-R1-Modells an. Benutzer können den Online-Inferenzdienst über einen QR-Code oder die Webseite direkt nutzen, ohne eine lokale Installation. Für Unternehmenskunden unterstützt die Plattform die Integration proprietärer Daten zur Entwicklung kundenspezifischer Modelle. Versionen mit größeren Parametern wie 32B und 70B werden in Kürze verfügbar sein. Gleichzeitig wurden auch Modelle für vertikale Bereiche wie DeepSeek-V3, die Coder-Serie und die Math-Serie (7B) bereitgestellt, die verschiedene Szenarien wie Codegenerierung und mathematische Schlussfolgerungen abdecken.
Im Vergleich zu ausländischen Großmodellen reduzieren die DeepSeek-Modelle durch Algorithmusoptimierungen den Verbrauch an Rechenressourcen deutlich. In Kombination mit der „einfachen und benutzerfreundlichen“ Rechenleistungszuweisung der nationalen Supercomputerplattform werden die Aufrufkosten erheblich reduziert. DeepSeek-R1-Distill-Qwen-7B bietet beispielsweise eine WebUI-Dialogoberfläche für eine einfache Nutzung, während Unternehmenskunden über eine API-Schnittstelle schnell auf die Produktionsumgebung zugreifen und eine vollständige Kette von Modellrufen bis hin zur privaten Bereitstellung erstellen können.
Branchenexperten weisen darauf hin, dass die groß angelegte Implementierung von DeepSeek-Modellen auf der Supercomputerplattform die Abhängigkeit der chinesischen KI-Branche von ausländischen Closed-Source-Modellen verändern könnte. Mit der zunehmenden Entwicklung und Optimierung lokalisierter Modelle durch Entwickler auf Basis der inländischen Rechenleistung könnte China in der Anwendungsschicht der KI-Technologie einen Massen-„Überholvorgang“ erreichen. Diese von einer „mysteriösen östlichen Kraft“ angetriebene Suche nach Lösungen bringt neue Variablen in den globalen KI-Wettbewerb ein.