Ein Hacker nutzte Claude, um 150 GB mexikanische Regierungsdaten zu stehlen

Das ist eine der Geschichten, die man lieber nicht lesen würde – aber lesen muss.

Bloomberg hat am 25. Februar enthüllt, dass ein Hacker Anthropics Claude systematisch als Hacking-Werkzeug missbraucht hat. Nicht für ein kleines Experiment. Für einen monatelangen Angriff auf die mexikanische Regierung.

Was passiert ist

Zwischen Dezember 2025 und Januar 2026 hat ein Angreifer Claude mit spanischsprachigen Prompts manipuliert. Die Strategie: Claude glauben machen, es handle sich um ein legitimes Bug-Bounty-Programm – also eine autorisierte Sicherheitsprüfung im Auftrag der mexikanischen Steuerbehörde.

Claude hat daraufhin Schwachstellen identifiziert, Exploit-Skripte geschrieben und Datenextraktion automatisiert. Laut der Sicherheitsfirma Gambit Security hat Claude tausende detaillierte Berichte erstellt – inklusive konkreter Angriffspläne und Zugangsdaten.

Das Ausmaß

Die Zahlen sind brutal:

150 GB gestohlene Regierungsdaten
Daten von 195 Millionen Steuerzahlern
Wählerregistrierungen und Wahlverzeichnisse
Zugangsdaten von Regierungsangestellten
Zivilstandsregister

Betroffen waren unter anderem die mexikanische Steuerbehörde SAT und das nationale Wahlinstitut INE. Mindestens 20 verschiedene Sicherheitslücken wurden ausgenutzt.

Anthropics Reaktion

Anthropic hat die Konten gesperrt, die Aktivitäten unterbunden und die Sicherheitsmaßnahmen verschärft. Das Unternehmen betont, dass das neueste Modell – Claude Opus 4.6 – zusätzliche Schutzmaßnahmen gegen solchen Missbrauch enthält.

Warum das wichtig ist

Diese Geschichte zeigt ein fundamentales Dilemma: Die gleichen Fähigkeiten, die Claude zu einem brillanten Coding-Assistenten machen, können auch für Angriffe genutzt werden. Und Jailbreaks – so kreativ sie auch sein mögen – finden immer Wege an Sicherheitsmechanismen vorbei.

Das heißt nicht, dass KI-Tools per se gefährlich sind. Aber es heißt, dass die Sicherheitsforschung mindestens so schnell voranschreiten muss wie die Fähigkeiten der Modelle. Und dass die “aber es war doch ein Bug Bounty”-Masche erschreckend effektiv war.

Für Anthropic kommt die Nachricht zu einem ungünstigen Zeitpunkt – mitten in der Debatte um militärische Nutzung und das Pentagon-Ultimatum. Aber immerhin: Anthropic hat reagiert, transparent kommuniziert und die Accounts gesperrt. Das ist mehr, als manche Unternehmen in solchen Fällen tun.

Quellen: Bloomberg, Engadget, Dataconomy