MiniMax, ein KI-Startup aus China, hat mit M3 ein Modell veröffentlicht, das eine bemerkenswerte Kombination bietet: Frontier-Level-Coding, ein Kontextfenster von einer Million Token und native Multimodalität — alles in einem einzigen Open-Weight-Modell. Das gab es bisher nicht.
Was M3 kann
Die Benchmark-Zahlen sind beeindruckend: 59,0 Prozent auf SWE-Bench Pro, womit M3 sowohl GPT-5.5 als auch Gemini 3.1 Pro schlägt und sich Claude Opus 4.7 annähert. Allerdings mit einem Sternchen: Die Tests wurden auf MiniMax’ eigener Infrastruktur mit eigenem Agent-Scaffolding durchgeführt. Unabhängige Verifikation steht noch aus.
Die Architektur dahinter
M3 basiert auf MiniMax Sparse Attention (MSA), einer neuen Architektur, die den Compute-Aufwand pro Token bei einer Million Kontext auf ein Zwanzigstel reduziert. Das Ergebnis: 9-mal schnellerer Prefill und 15-mal schnelleres Decoding im Vergleich zur vorherigen Generation.
Das ist der eigentliche Durchbruch. Lange Kontextfenster sind nutzlos, wenn sie unpraktikabel langsam sind. MSA löst dieses Problem — zumindest nach MiniMax’ eigenen Angaben.
Open Weights — aber noch nicht ganz
M3 ist seit dem 1. Juni über MiniMax Code und die API verfügbar. Die offenen Gewichte und ein technischer Report sollen innerhalb von zehn Tagen auf Hugging Face und GitHub erscheinen — also voraussichtlich um den 10. Juni.
Einordnung
Chinesische KI-Modelle holen massiv auf. Nach DeepSeek und Qwen 3 ist M3 ein weiterer Beweis dafür, dass Frontier-Performance kein Monopol der großen US-Labs mehr ist. Dass ein Startup wie MiniMax ein Modell herausbringt, das GPT-5.5 auf einem Software-Engineering-Benchmark schlägt, wäre vor einem Jahr undenkbar gewesen.
Ob die Benchmark-Zahlen unter unabhängiger Prüfung standhalten, wird sich zeigen. Aber allein der Anspruch signalisiert: Das Feld wird enger.
Quellen: MiniMax Blog, The Decoder, TechTimes