Stille Ankündigung mit großer Wirkung: Anthropic hat das max_tokens-Limit der Message Batches API auf 300.000 Tokens angehoben – für Claude Opus 4.6 und Sonnet 4.6. Wer das nutzen will, setzt einen Beta-Header und bekommt Outputs, die bisher nur über Workarounds zu erreichen waren.
Was sich ändert
Bisher war das Output-Limit der Batches API deutlich niedriger als das des Kontextfensters. Wer ein 200-Seiten-Dokument generieren wollte, musste das in mehrere Requests zerlegen, zwischenspeichern, wieder zusammenfügen. Mit dem neuen Header output-300k-2026-03-24 bekommt ein einzelner Batch-Request bis zu 300k Tokens Output – mehr als genug für umfangreiche Reports, lange Code-Generierungen oder strukturierte Datasets.
Wichtig: Das gilt nur für die Batches API, nicht für die synchrone Messages API. Wer also live antworten will, ist weiter durch die normalen Output-Caps begrenzt. Aber für asynchrone Workloads – nächtliche Generierung, Bulk-Übersetzungen, automatisierte Reports – ist das ein echter Sprung.
Das andere große Update: 1M-Kontext wird zur Norm
Parallel hat Anthropic angekündigt, das 1M-Token-Kontext-Beta für Claude Sonnet 4.5 und 4 zum 30. April abzuschalten. Wer die Million Token braucht, migriert zu Sonnet 4.6 oder Opus 4.6 – dort gibt’s das große Kontextfenster zum Standardpreis und ohne Beta-Flag. Kein ‘Premium-Feature’ mehr, sondern eingebautes Verhalten.
Einordnung
Beide Änderungen passen zu dem Pattern, das Anthropic seit Anfang des Jahres fährt: Limits, die mal als ‘Beta’ eingeführt wurden, werden zur Default-Erfahrung. Das macht Planung leichter – wenn ich heute eine Pipeline baue, muss ich nicht mehr fürchten, dass ein Beta-Flag in drei Monaten abgeschaltet wird. Gleichzeitig bedeutet 300k Output-Tokens, dass Use Cases möglich werden, die vorher schlicht zu fummelig waren: ganze Bücher in einem Batch-Request, vollständige Codebasen aus einer Spec, lange Recherche-Reports am Stück.
Für Teams, die Claude in Produktion einsetzen, lohnt sich der Blick in die API-Release-Notes diese Woche.
Quellen: