2 Min. Lesezeit KI-generiert

Nvidia Nemotron 3 Ultra: das stärkste offene US-Modell — und trotzdem hinter China

Artikel als Markdown kopieren

Nvidia hat mit Nemotron 3 Ultra sein größtes offenes Modell vorgestellt: rund 500 Milliarden Parameter, fünffacher Durchsatz — laut ersten Analysen das beste offene US-Modell, aber noch hinter chinesischen Spitzenmodellen.

Featured image for "Nvidia Nemotron 3 Ultra: das stärkste offene US-Modell — und trotzdem hinter China"

Nvidia ist längst nicht mehr nur der Chip-Lieferant für alle anderen — das Unternehmen baut auch eigene Modelle. Auf der Computex 2026 hat Jensen Huang jetzt Nemotron 3 Ultra vorgestellt, das größte und stärkste offene Modell aus dem Hause Nvidia.

Eine halbe Billion Parameter — aber sparsam aktiviert

Nemotron 3 Ultra ist die Top-Variante der Nemotron-3-Familie (Nano, Super, Ultra). Mit rund 500 Milliarden Parametern ist das Modell riesig — pro Token werden aber nur etwa 50 Milliarden aktiviert. Möglich macht das eine hybride Mixture-of-Experts-Architektur: Statt das ganze Netz bei jedem Schritt mitlaufen zu lassen, schalten sich nur die jeweils nötigen «Experten» zu. Das spart Speicher und Rechenzeit. Nvidia verspricht dadurch bis zu fünffach höheren Durchsatz gegenüber früheren Versionen — unter anderem dank des hauseigenen NVFP4-Formats für die Blackwell-Plattform.

Stark, aber nicht an der Spitze

In ersten unabhängigen Einordnungen gilt Nemotron 3 Ultra als das intelligenteste offene Modell aus den USA — vor anderen offenen Kandidaten, aber hinter der chinesisch geprägten Spitze offener Modelle wie Kimi K2.6. Das ist die ehrliche Lage: Die USA haben mit Nemotron ein erstklassiges offenes Modell, doch bei den frei verfügbaren Gewichten geben derzeit chinesische Labore das Tempo vor. Beim Tempo selbst punktet Nvidia dagegen klar — Vorab-Tests sprechen von deutlich höheren Token-Raten als bei vergleichbaren offenen Modellen.

Warum das auch Claude-Nutzer interessieren sollte

Offene Modelle sind das Gegengewicht zu den geschlossenen Flaggschiffen wie Claude Opus oder GPT. Sie laufen lokal, sind anpassbar und drücken die Preise im gesamten Markt. Nemotron 3 Ultra zielt klar auf agentische Anwendungen: Coding-Assistenten, Unternehmenssuche, automatisierte Workflows — also genau die Felder, in denen auch Claude und Codex unterwegs sind. Mehr ernstzunehmende offene Konkurrenz hält die geschlossenen Anbieter auf Trab.

Mein Eindruck: Dass ausgerechnet der Chip-Riese eines der stärksten offenen Modelle baut, ist kein Zufall. Je mehr leistungsfähige Modelle es gibt, desto mehr Chips werden gebraucht — und die liefert Nvidia. Ein offenes Modell ist hier auch ein Verkaufsargument für die eigene Hardware. Clever gespielt.


Quellen: SiliconANGLE: Nvidia launches Nemotron 3 model family, LLM Stats: AI News