Die chinesische KI-Firma DeepSeek hat mit ihrer App die Charts der kostenlosen Apps im Apple App Store in China und den USA erobert und damit ChatGPT überholt.
Dieser Erfolg hat nicht nur große Aufmerksamkeit auf dem Markt erregt, sondern auch erhebliche Auswirkungen auf den Aktienkurs des KI-Chip-Giganten Nvidia gehabt. Trotzdem lobte ein Nvidia-Sprecher DeepSeek als bemerkenswerten Fortschritt im Bereich der KI und betonte, dass DeepSeek gezeigt habe, wie man mit Testzeit-Skalierungstechniken, allgemein verfügbaren Modellen und exportkontrollkonformen Rechenressourcen neue Modelle erstellen kann.
Der Nvidia-Sprecher fügte hinzu, dass der Inferenzprozess eine große Anzahl von Nvidia-GPUs und ein Hochleistungsnetzwerk erfordert. Nvidia beherrscht derzeit drei Skalierungsmethoden: kontinuierliches Pre-Training und Post-Training sowie die neue Testzeit-Skalierungstechnik. Diese Aussage impliziert auch, dass die von DeepSeek verwendeten GPUs den US-Exportkontrollbestimmungen entsprechen.
Die Testzeit-Skalierungstechnik ist in den letzten Jahren ein viel diskutiertes Thema. Sie besagt, dass ein vollständig trainiertes KI-Modell bei der Vorhersage, der Text- oder Bilderzeugung qualitativ hochwertigere Ergebnisse liefert, wenn mehr Rechenressourcen für die Inferenz eingesetzt werden. Diese Technik wird bereits in Modellen wie OpenAIs o1 eingesetzt.
Am 27. Januar zeigten die drei wichtigsten US-Aktienindizes einen uneinheitlichen Handel. Der Nvidia-Aktienkurs stürzte um 16,86 % ab und schloss bei 118,58 US-Dollar pro Aktie – dem niedrigsten Stand der letzten 10 Monate. Die Marktkapitalisierung von Nvidia beträgt 2,90 Billionen US-Dollar, wobei an einem Tag 590 Milliarden US-Dollar verloren gingen – ein Rekord für den größten jemals an einem Tag verzeichneten Verlust der Marktkapitalisierung eines Einzeltitels. Der Kurssturz von Nvidia führte auch zu einem erheblichen Vermögensverlust von 21 Milliarden US-Dollar für Gründer Jensen Huang.
Unter der Führung von Nvidia erlitt der US-amerikanische Halbleiter-Chipsektor insgesamt Verluste. DeepSeek ist eine Tochtergesellschaft des quantitativen Investment-Giganten QuantConnect und veröffentlichte am 20. Januar sein Inferenz-Sprachmodell DeepSeek-R1. R1 erlangte aufgrund seiner hervorragenden Leistung, seines Open-Source-Charakters sowie deutlich reduzierter Preise und Trainingskosten große Aufmerksamkeit. Die Pre-Training-Kosten für R1 betrugen lediglich 5.576.000 US-Dollar und der Trainingslauf wurde auf einem Cluster aus 2048 Nvidia H800 GPUs in 55 Tagen abgeschlossen.
Wichtigste Punkte:
📈 DeepSeek-App erreicht Platz 1 der kostenlosen App-Downloads im Apple App Store in China und den USA.
💬 Nvidia bezeichnet DeepSeek als bemerkenswerten Fortschritt im Bereich der KI; die Inferenz erfordert eine große Anzahl von GPUs.
💸 Nvidia-Aktienkurs stürzt um 16,86 % ab, Verlust von 590 Milliarden US-Dollar an einem Tag – Rekord für den größten jemals an einem Tag verzeichneten Verlust der Marktkapitalisierung eines Einzeltitels.