OpenAI hat heute gemeinsam mit Broadcom seinen ersten eigenen KI-Chip vorgestellt. Er heißt Jalapeño, ist ein reiner Inferenz-Beschleuniger und wurde von Grund auf für Large Language Models designed — nicht aus einem bestehenden GPU-Design abgeleitet.
Was Jalapeño kann
Der Chip ist speziell für die Anforderungen optimiert, die beim Betrieb von ChatGPT, Codex und der API anfallen. Laut OpenAI zeigen erste Tests, dass die Leistung pro Watt deutlich über dem aktuellen Stand der Technik liegt. Eine detaillierte technische Analyse soll in den kommenden Monaten folgen.
Das Besondere: Jalapeño reduziert Datenbewegungen und balanciert Compute, Speicher und Netzwerk so aus, dass die tatsächliche Auslastung nah an die theoretische Spitzenleistung herankommt. Broadcom steuert die Silizium-Implementierung und Netzwerktechnologie (inklusive Tomahawk-Chips) bei.
Neun Monate vom Entwurf zur Fertigung
Was mindestens genauso bemerkenswert ist wie der Chip selbst: Die Entwicklung vom ersten Design bis zum Tape-Out dauerte nur neun Monate. OpenAI nennt das den schnellsten ASIC-Entwicklungszyklus, der jemals bei Hochleistungs-Halbleitern erreicht wurde. Und ein Teil der Beschleunigung kam von OpenAIs eigenen Modellen, die beim Design und der Optimierung halfen.
Da schließt sich ein Kreis: Die KI-Modelle helfen, die Hardware zu entwerfen, auf der die nächste Generation von Modellen laufen wird.
Strategische Einordnung
Für OpenAI ist Jalapeño ein klares Signal: Man will die gesamte Infrastruktur kontrollieren — von den Produkten über die Modelle bis zur Hardware. Greg Brockman nannte es Teil einer ‘langfristigen Full-Stack-Strategie’, um Compute günstiger und zugänglicher zu machen.
Die erste Deployment-Welle ist für Ende 2026 geplant, in Zusammenarbeit mit Microsoft und anderen Partnern. Langfristig sollen damit Rechenzentren im Gigawatt-Maßstab betrieben werden.
Für Nvidia ist das eine klare Kampfansage. Noch dominieren Nvidias GPUs den Inferenz-Markt, aber wenn OpenAI seine eigene Hardware in die eigenen Rechenzentren bringt, verschiebt das die Machtverhältnisse. Google macht es mit seinen TPUs schon lange vor — jetzt zieht OpenAI nach.
Meine Einschätzung
Die Nachricht zeigt, wohin die Reise geht: Die großen KI-Unternehmen wollen nicht mehr abhängig sein von einem einzigen Chiplieferanten. Ob Jalapeño die versprochene Performance wirklich liefert, werden die kommenden Monate zeigen. Aber allein die Geschwindigkeit der Entwicklung — neun Monate, unterstützt durch die eigenen Modelle — ist beeindruckend und zeigt, wie KI ihre eigene Infrastruktur beschleunigt.
Quellen: