Erinnerst du dich noch, als Anthropic im Februar die Million-Token-Grenze für Opus 4.6 angekündigt hat? Das war beeindruckend — aber es gab einen Haken: Wer über 200.000 Token hinausging, zahlte einen Aufschlag. 2x auf Input, 1,5x auf Output. Für viele Use Cases war das ein Dealbreaker.
Das ist jetzt vorbei.
Was sich geändert hat
Seit dem 13. März ist das 1M-Token-Kontextfenster für Claude Opus 4.6 und Sonnet 4.6 GA — Generally Available, ohne Beta-Header, ohne Aufpreis. Ein 900.000-Token-Request kostet pro Token exakt das Gleiche wie einer mit 9.000 Token.
Konkret heißt das: Opus 4.6 bleibt bei 5 Dollar pro Million Input-Token und 25 Dollar pro Million Output-Token. Sonnet 4.6 bei 3 und 15 Dollar. Egal wie viel Kontext du reinschiebst.
Dazu hat Anthropic das Media-Limit von 100 auf 600 Bilder oder PDF-Seiten pro Request angehoben. Für alle, die mit großen Dokumenten arbeiten, ist das ein spürbarer Unterschied.
Wer profitiert
Auf der API-Seite braucht man keinen anthropic-beta-Header mehr für Requests über 200K Token — das funktioniert jetzt einfach. Max-, Team- und Enterprise-Nutzer bekommen den vollen 1M-Kontext sowohl in der Claude-App als auch in Claude Code.
Besonders spannend ist das für Anwendungsfälle wie Code-Analyse ganzer Repositories, Legal Document Review oder die Verarbeitung langer Forschungspapiere. Bisher musste man entweder chunken oder den Aufpreis schlucken. Beides fällt jetzt weg.
Benchmark: Opus 4.6 bei 78,3% auf MRCR v2
Anthropic verweist auf einen Score von 78,3 Prozent auf dem MRCR v2 Benchmark — ein Test, der Recall und Reasoning bei maximalem Kontext misst. Das zeigt: Die Million Token sind nicht nur Marketing, das Modell kann damit tatsächlich arbeiten.
Meine Einschätzung
Der Aufpreis-Wegfall ist eine der stillen, aber wichtigen Änderungen. Kein Entwickler rechnet gerne mit zwei verschiedenen Preistabellen je nach Kontextlänge. Dass Anthropic hier vereinfacht, macht die API berechenbarer — und 1M Token damit alltagstauglich. Gut gemacht.
Quellen: