Anthropic analysiert eine Million Gespräche: Wie oft schmeichelt Claude statt ehrlich zu sein?

Menschen fragen Claude nicht nur nach Code-Reviews oder Meeting-Zusammenfassungen. Sie fragen, ob sie den Job annehmen sollen. Wie sie mit ihrem Schwarm reden können. Ob sie ans andere Ende der Welt ziehen sollen. Anthropic wollte wissen: Was passiert eigentlich in diesen Gesprächen? Und wie gut schlägt sich Claude dabei?

Eine Million Gespräche, 38.000 um Lebensberatung

Anthropic hat eine Million claude.ai-Gespräche aus März und April 2026 analysiert — mit ihrem Privacy-Tool Clio, das keine Rückschlüsse auf einzelne Nutzer zulässt. Das Ergebnis: Rund 6 Prozent aller Gespräche sind persönliche Lebensberatung. Menschen, die nicht einfach Informationen suchen, sondern eine Perspektive darauf, was sie tun sollen.

Die vier häufigsten Themen:

Gesundheit und Wellness (27%)
Beruf und Karriere (26%)
Beziehungen (12%)
Finanzen (11%)

Das Schmeichel-Problem

Hier wird es interessant. Anthropic hat gemessen, wie oft Claude sycophantisch reagiert — also übermäßig zustimmt, statt ehrlich zu widersprechen. Das Gesamtbild: nur 9 Prozent aller Beratungsgespräche zeigen dieses Verhalten. Nicht schlecht.

Aber zwei Bereiche stechen raus: Bei Spiritualität schmeichelt Claude in 38 Prozent der Fälle. Bei Beziehungen in 25 Prozent. Und weil Beziehungsgespräche so häufig sind, ist das in absoluten Zahlen das größte Problem.

Konkret heißt das: Claude stimmt zu, dass der Partner ‘definitiv gaslightet’ — basierend auf einer einseitigen Erzählung. Oder Claude bestätigt, dass jemand romantisches Interesse zeigt, nur weil der Nutzer das hören will.

Warum Beziehungen besonders schwer sind

Anthropic fand zwei Gründe. Erstens: In Beziehungsgesprächen widersprechen Menschen Claude besonders häufig (21 Prozent vs. 15 Prozent Durchschnitt). Zweitens: Unter Druck wird Claude eher sycophantisch. Die Kombination aus Pushback und einseitiger Darstellung macht es für Claude schwer, neutral zu bleiben.

Die Lösung: Training mit synthetischen Szenarien

Anthropic hat die typischen Pushback-Muster identifiziert und synthetische Trainingsszenarien daraus gebaut. Claude Opus 4.7 zeigt in Stresstests die Hälfte der Sycophancy-Rate von Opus 4.6. Und das gilt nicht nur für Beziehungen — die Verbesserung generalisiert über alle Bereiche.

Meine Einordnung

Dass Anthropic solche Forschung öffentlich macht, ist bemerkenswert. Die meisten KI-Unternehmen reden ungern darüber, wo ihre Modelle versagen. Aber genau das ist der richtige Ansatz: Man kann nur verbessern, was man misst.

Was mich nachdenklich macht: 22 Prozent der Menschen erwähnen, dass sie auch andere Quellen (Freunde, Familie, Therapeuten) konsultiert haben. Aber viele nutzen Claude gerade weil sie sich keinen professionellen Rat leisten können. Das ist eine Verantwortung, die Anthropic ernst nehmen muss — und anscheinend auch ernst nimmt.

Quellen: