Open-Weight-Agenten haben aufgeschlossen — die Experten-Bilanz

Eine Modellveröffentlichung ist das eine. Das Urteil der Leute, die täglich mit diesen Modellen arbeiten, ist das andere — und das fällt diese Woche überraschend deutlich aus. Nathan Lambert (interconnects.ai) hat vor wenigen Stunden eine Analyse veröffentlicht, deren Titel schon alles sagt: GLM-5.2 sei der ‘Step Change’ für offene Agenten.

Worum es geht

GLM-5.2 vom chinesischen Labor Z.ai ist seit gut einer Woche als Open-Weight-Modell unter MIT-Lizenz verfügbar — 753 Milliarden Parameter, davon nur rund 40 Milliarden aktiv. Über das Modell selbst haben wir schon berichtet. Neu ist die Einordnung: In Community-Benchmarks schlägt es sich besser als erwartet, und auf Arenas Agenten-Leaderboard ist es laut Lambert das einzige offene Modell, das mit den aktuellen Topmodellen von OpenAI und Anthropic mithält.

Auch Simon Willison hatte das Modell schon als «wahrscheinlich das stärkste rein textbasierte Open-Weight-LLM» bezeichnet. Zwei der nüchternsten Stimmen der Szene kommen also unabhängig zu einem ähnlichen Schluss.

Warum das mehr ist als ein Benchmark-Sieg

Der Punkt ist nicht, dass ein einzelnes Modell ein paar Prozentpunkte gutmacht. Der Punkt ist die Verschiebung dahinter: Bei agentischen Aufgaben — also mehrschrittiges Planen, Tool-Nutzung, langes Durchhalten — galt der Abstand zwischen offenen und geschlossenen Modellen lange als groß. Genau dort schließt sich die Lücke jetzt sichtbar. Wer ein offenes Modell selbst hosten, feintunen oder einfach unabhängig von einem Anbieter bleiben will, hat plötzlich eine ernstzunehmende Option.

Meine Einordnung

Für uns Claude-Nutzer ist das keine schlechte Nachricht — im Gegenteil. Konkurrenz von offener Seite hält den Druck hoch und zwingt alle, besser zu werden. Anthropic und OpenAI bleiben bei den absoluten Spitzenmodellen vorne, aber der Komfortabstand schrumpft.

Ich bleibe trotzdem realistisch: «Hält mit» heißt nicht «ist gleich gut» im Alltag, und ein 753B-Modell lokal zu betreiben ist kein Hobbyprojekt. Aber die Richtung ist eindeutig. Wenn offene Agenten so weitermachen, wird die spannende Frage nicht mehr nur sein, welches Modell das beste ist — sondern wem die Infrastruktur gehört, auf der wir bauen.

Quellen: interconnects.ai: GLM-5.2 is the step change for open agents, Simon Willison: GLM-5.2