Kimi K2.7-Code: Moonshots Open-Source-Modell will dein Coding-Agent sein

Während alle auf das Fable-5-Drama bei Anthropic geschaut haben, hat ein chinesisches Labor still und leise nachgelegt: Moonshot AI hat Kimi K2.7-Code veröffentlicht — ein Modell, das nicht versucht, der beste Allrounder der Welt zu sein. Es will eins: Code schreiben. Und zwar als Agent, der sich durch deine Codebasis arbeitet.

Was da freigegeben wurde

Kimi K2.7-Code ist ein Mixture-of-Experts-Modell mit einer Billion Parametern — aber nur 32 Milliarden sind pro Anfrage aktiv (384 Experten, von denen jeweils eine Handvoll feuert). Das Kontextfenster liegt bei 256.000 Tokens. Die Gewichte stehen auf Hugging Face, die Lizenz ist eine modifizierte MIT-Variante. Also: selbst hosten erlaubt, kommerziell nutzen erlaubt, nur die ganz großen Anbieter müssen über Moonshots Bezahlkanal.

Spannend sind die Zahlen, die Moonshot mitliefert: +21,8 Prozent auf dem hauseigenen Kimi Code Bench v2 gegenüber K2.6, dazu rund 30 Prozent weniger Reasoning-Tokens für dieselbe Aufgabe. Das ist die Kennzahl, die in der Praxis zählt — weniger Tokens heißt weniger Kosten und schnellere Antworten.

Der Preis ist die eigentliche Ansage

0,95 Dollar pro Million Input-Tokens, 4,00 Dollar pro Million Output. Zum Vergleich: Claudes Fable 5 liegt bei 10 und 50 Dollar. Natürlich ist das kein fairer Eins-zu-eins-Vergleich — ein Frontier-Modell von Anthropic kann mehr als ein spezialisierter Coding-Agent. Aber für die enge Aufgabe «arbeite einen Pull Request ab» wird genau dieser Abstand interessant.

Und das Timing ist kein Zufall, sondern fast schon Comedy: Einen Tag bevor Anthropic die Agenten-Abrechnung in einen separaten Credit Pool auslagert — du erinnerst dich, ab dem 15. Juni — legt Moonshot ein offenes Modell hin, das genau die Leute anspricht, die jetzt über ihre Token-Rechnung nachdenken.

Meine Einordnung

Ich bin vorsichtig mit Benchmark-Versprechen von Laboren, die ihre eigenen Benchmarks bauen. «+31,5 Prozent auf MLS Bench Lite» sagt mir wenig, solange ich es nicht selbst an echtem Code gesehen habe. Was mich trotzdem aufhorchen lässt: Open Weights, langer Kontext, aggressiver Preis. Das ist die Kombination, die Druck macht.

Claude Code bleibt für mich das rundere Gesamtpaket — Tooling, Plugins, die ganze Umgebung drumherum. Aber dass ein offenes Modell überhaupt in diese Diskussion kommt, ist genau die Entwicklung, die ich als Nutzer gut finde. Konkurrenz hält die Preise unten und das Tempo hoch.

Quellen: MarkTechPost: Kimi K2.7-Code, LLM Stats: Kimi K2.7 Code, OpenRouter: moonshotai/kimi-k2.7-code