Am 8. April 2025 gab NVIDIA die Einführung seines neuesten großen Sprachmodells (LLM) – Llama3.1Nemotron Ultra253B – bekannt. Dieses Modell basiert auf Metas Llama-3.1-405B-Instruct und wurde durch innovative neuronale Architektursuche (NAS) tiefgreifend optimiert. Es übertrifft nicht nur die kürzlich veröffentlichten Modelle Behemoth und Maverick aus der Llama4-Serie, sondern wird auch als Open-Source-Modell auf der Hugging Face-Plattform veröffentlicht, was große Aufmerksamkeit in der KI-Community erregt.

QQ_1744161895807.png

Leistungsdurchbruch: Übertrifft Llama4 Behemoth und Maverick

Nach Angaben von NVIDIA und aktuellen Diskussionen in sozialen Medien zeigt Llama3.1Nemotron Ultra253B in mehreren wichtigen Benchmark-Tests hervorragende Ergebnisse. Das Modell verfügt über 253 Milliarden Parameter. Im Vergleich zu Llama4 Behemoth mit 2 Billionen Parametern (288 Milliarden aktive Parameter) und Maverick mit 17 Milliarden aktiven Parametern, erreicht Nemotron Ultra einen bemerkenswerten Durchbruch in Bezug auf Effizienz und Leistungsbalance.

Obwohl die genauen Benchmark-Daten noch nicht vollständig veröffentlicht wurden, soll Nemotron Ultra die Flaggschiff-Modelle der Llama4-Serie in Bezug auf Inferenzfähigkeit, Anweisungsbefolgung und allgemeine Aufgabenverarbeitung übertreffen. Dies ist der Optimierung der Modellarchitektur durch NVIDIA mittels NAS-Technologie zu verdanken, die den Speicherbedarf und die Inferenzlatenz deutlich reduziert, während gleichzeitig eine hohe Genauigkeit beibehalten wird. Im Gegensatz dazu ist Llama4 Behemoth zwar parameterreich, aber deutlich rechenintensiver. Nemotron Ultra hingegen kann effizient auf einem Einzelknoten mit 8x H100-GPUs betrieben werden, was seine praktische Anwendbarkeit unterstreicht.

Open-Source-Veröffentlichung: Kommerziell nutzbares Modell auf Hugging Face

Llama3.1Nemotron Ultra253B überzeugt nicht nur durch seine Leistung, sondern auch durch seine Open-Source-Strategie. Das Modell steht auf der Hugging Face-Plattform mit offenen Gewichten zur Verfügung und unterliegt der NVIDIA Open Model License und der Llama3.1-Community-Lizenz, die die kommerzielle Nutzung erlaubt.

Es wird behauptet, dass Nemotron Ultra253B nicht nur Llama4 Behemoth und Maverick übertrifft, sondern auch mit DeepSeek R1 mithalten kann und eine kommerzielle Lizenz besitzt – ein echter Hit! Diese Maßnahme wird als wichtiger Schritt von NVIDIA zur Förderung der Demokratisierung von KI angesehen und bietet Entwicklern, Unternehmen und Forschern einen einfachen Zugang zu leistungsstarken Modellen.

Darüber hinaus unterstützt das Modell eine Kontextlänge von bis zu 128.000 Token und eignet sich für verschiedene Aufgaben wie hochentwickelte Inferenz, Chat-Interaktionen, Retrieval-Augmented Generation (RAG) und Tool-Calls. NVIDIA betont besonders, dass Entwickler über System-Prompts den „Inferenzmodus“ (Reasoning On/Off) umschalten können, um flexibel auf die Anforderungen verschiedener Anwendungsszenarien zu reagieren.

Es ist zu beachten, dass Llama4 Behemoth noch nicht vollständig veröffentlicht ist (derzeit noch in der Trainingsphase), daher ist ein direkter Vergleich möglicherweise noch nicht umfassend. Dennoch gilt Nemotron Ultra aufgrund seiner Open-Source-Natur und der effizienten Anpassung an Einzel-GPU-Cluster als aktuelles Highlight im KI-Bereich.

QQ_1744161906170.png

Die strategische Positionierung von NVIDIA

Branchenexperten analysieren, dass die Veröffentlichung von Llama3.1Nemotron Ultra253B nicht nur einen technischen Durchbruch darstellt, sondern auch die strategische Positionierung von NVIDIA im KI-Ökosystem widerspiegelt. Durch die Optimierung bestehender Open-Source-Modelle und die Steigerung ihrer Leistung zeigt NVIDIA nicht nur seine Stärke in der KI-Softwareentwicklung, sondern festigt auch die zentrale Rolle seiner Hardware (insbesondere der H100-GPU) bei KI-Inferenz und -Training. Der Effizienzvorteil dieses Modells bedeutet, dass Unternehmen kostengünstiger leistungsstarke KI-Lösungen einsetzen können, was die Marktnachfrage nach NVIDIA-Hardware zweifellos steigern wird.

Das Erscheinen von Llama3.1Nemotron Ultra253B markiert einen weiteren bedeutenden Fortschritt von NVIDIA im Bereich der großen Sprachmodelle. Seine überragende Leistung gegenüber Llama4 Behemoth und Maverick, kombiniert mit Open-Source- und kommerziell freundlichen Eigenschaften, macht es zu einem der Highlights im KI-Bereich des Jahres 2025.

Projekt-Link: https://top.aibase.com/tool/llama-3-1-nemotron-ultra-253b