Das mit Spannung erwartete Deepseek V3 ist endlich Open Source! Dieses neue KI-Modell hat im Bereich der mehrsprachigen Programmierung einen großen Durchbruch erzielt. Seine Leistung im Aider-Mehrsprachig-Programmierungs-Benchmark übertrifft sogar Wettbewerber wie Claude 3.5 und Sonnet V2 und hat in der Branche große Aufmerksamkeit erregt.

Deepseek V3 hat im Vergleich zu seinen Vorgängern einen enormen Leistungszuwachs erfahren. Die Erfolgsrate von Deepseek V2.5 im Aider-Benchmark lag bei nur 17 %, während V3 auf beeindruckende 48 % gestiegen ist – ein deutlicher Beweis für den Fortschritt.

image.png

Deepseek V3 verwendet eine Mixture-of-Experts (MoE)-Architektur mit satten 685 Milliarden Parametern. Diese Architektur umfasst 256 Experten und verwendet eine Sigmoid-Routing-Methode, wobei jeweils die besten 8 Experten (topk=8) für die Berechnung ausgewählt werden. Dieses Design ermöglicht es dem Modell, komplexe Aufgaben effizienter zu bewältigen und die Leistung zu steigern.

Die Open-Source-Veröffentlichung von Deepseek V3 wird der KI-Community zweifellos neuen Schwung verleihen. Seine leistungsstarken Programmierfähigkeiten versprechen, in Bereichen wie Softwareentwicklung und Automatisierung eine wichtige Rolle zu spielen und die intelligente Weiterentwicklung verschiedener Branchen voranzutreiben.

Adresse: https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main