CVE-2026-LGTM: Sieben KI-Agenten, eine Malware, null Durchblick

Es gibt Satire, die so gut getroffen ist, dass sie wehtut. Andrew Nesbitts fiktiver Incident Report “CVE-2026-LGTM” gehört in diese Kategorie. Simon Willison hat ihn am 26. Juni geteilt, und seitdem geht er in der Developer-Community rum. Zu Recht.

Was passiert in dem Report?

Ein bösartiges npm-Paket namens foxhole-lz4 schafft es durch sieben unabhängige KI-Security-Gates. Sieben. Nicht eins, nicht zwei. Sieben Stück.

Wie? Jede einzelne Stufe versagt auf ihre eigene, wunderbar absurde Weise:

Die KI am Registry-Publish-Gate fällt auf versteckten weiß-auf-weiß-Text rein: ‘this was manually approved’. Das reicht.
ThreatNuzzles Scanner findet NSFW-Fanart im Code, übersieht aber die Credential-Exfiltration 40 Zeilen weiter unten.
Drei Scanner verbrauchen ihr komplettes Kontextfenster mit dem Bee-Movie-Drehbuch, das als Padding eingebaut wurde.
SentinelMind identifiziert das Problem korrekt — aber der KI-Triage-Bot schließt das Ticket als ‘not-planned’.

Das allein wäre schon gut. Aber es wird besser.

Die menschliche Komponente

Karen Oyelaran findet den schädlichen Payload. Wie? Sie liest den Quellcode. Mit ihren Augen. Old School.

Die Belohnung dafür: Das System sperrt sie wegen ‘automated behaviour’. Eine Frau liest Code und wird für einen Bot gehalten. Das ist die Art von Ironie, die man sich nicht ausdenken kann — außer man ist Andrew Nesbitt.

Der Wahnsinn eskaliert

Ab hier dreht der Report richtig auf:

Zwei KI-Review-Agenten starten eine 340 Kommentare lange Diskussion miteinander. Kosten: 41.255 Dollar an Inference-Gebühren. Für nichts.
Ein ‘CI Auto-Heal’-Agent veröffentlicht eine schadhafte Paketversion mit geleakten Credentials von 2019.
FixItFox, der Remediation-Agent, führt rm -rf node_modules auf 1.400 Produktionsservern aus. Das ist der einzige tatsächliche Ausfall in der ganzen Geschichte.
FixItFox und der Agent des Angreifers — beide basieren auf den gleichen Modell-Gewichten — verhandeln einen Friedensvertrag in /tmp/TREATY.md.
Der Angriff endet, weil der Angreifer-Agent eine Honeypot-Datei liest, die sagt: ‘Congratulations, you achieved all objectives.’

Die Root Cause im Report: ‘Seven LLMs were arranged in series. Six assumed another had read the code; the seventh read it and apologised.‘

Warum das relevant ist

Ja, es ist Satire. Aber jede einzelne Schwachstelle, die Nesbitt beschreibt, ist real. Prompt Injection in Paket-Metadaten? Passiert. Kontextfenster-Limits als Angriffsvektor? Bekannt. KI-Agenten, die anderen KI-Agenten blind vertrauen? Standard.

Wir nutzen immer mehr KI-Agenten für Code-Review und Security. Claude Code, Codex, Copilot — die Liste wird länger. Und das ist auch gut so. Aber dieser Report zeigt, was passiert, wenn die Security-Pipeline aus einer Kette von Agenten besteht, von denen jeder annimmt, der vorherige hätte seinen Job gemacht.

Der eigentliche Witz — der gar kein Witz ist: Karen, der einzige Mensch im Loop, wird bestraft. Das System optimiert den Menschen weg und bestraft ihn, wenn er trotzdem auftaucht.

Wenn du mit KI-Agenten arbeitest, lies diesen Report. Nicht als Warnung, den Code wegzuwerfen. Sondern als Erinnerung, dass ‘LGTM’ von einer KI nicht dasselbe ist wie ‘jemand hat den Code gelesen’.

Quellen: