Das in Hangzhou ansässige KI-Unternehmen DeepSeek hat kürzlich sein neuestes großes Sprachmodell – V3 – veröffentlicht. Dieses Open-Source-Modell erreicht in mehreren Benchmark-Tests Ergebnisse, die denen von OpenAIs 4o und Anthropics Claude 3.5 Sonnet nahekommen, was die Branche beeindruckt. Im Vergleich zu den oft mehrere hundert Millionen Dollar teuren Entwicklungen amerikanischer Wettbewerber beliefen sich die Gesamtkosten für DeepSeks V3-Modell lediglich auf 5,6 Millionen US-Dollar – ein bemerkenswerter Unterschied.

Großes Sprachmodell Metaverse (1)

Bildquelle: Das Bild wurde mit KI generiert, Lizenzgeber ist Midjourney.

DeepSeks CEO Liang Wenfeng erklärte, dass Finanzierung nie ein Problem für sie gewesen sei. Obwohl V3 auf H800-Chips trainiert wurde, konnte das DeepSeek-Team auch mit begrenzten Ressourcen beeindruckende Forschungs- und Entwicklungsleistungen erbringen.

Der KI-Pionier Andrej Karpathy kommentierte dies mit den Worten, DeepSeks Investitionsbudget sei „ein Witz“, das Ergebnis jedoch „eine beeindruckende Forschungs- und Entwicklungsleistung unter Ressourcenbeschränkungen“.

AGI wird als der „heilige Gral“ der KI-Forschung angesehen, der Menschen in der Problemlösung und Aufgabenbewältigung übertreffen soll. Experten prognostizieren, dass das Land, das AGI als erstes realisiert, sobald die Technologie ausgereift ist, enorme wirtschaftliche, wissenschaftliche und sicherheitspolitische Vorteile erlangen wird.