Warum KI selbstbewusst Dinge erfindet
Von Chatday Editorial Team ·
Stelle einem KI-Chatbot eine Frage, deren Antwort er nicht kennt, und hier kommt der beunruhigende Teil: Er sagt fast nie „ich bin mir nicht sicher”. Stattdessen liefert er dir oft eine selbstbewusste, ausgefeilte, vollständig erfundene Antwort: einen falschen Buchtitel, ein Zitat, das niemand gesagt hat, ein Gesetz, das es gar nicht gibt. Die KI lügt nicht absichtlich. Sie erkennt schlicht den Unterschied nicht. Und sobald du verstehst, warum das passiert, lässt du dich nie wieder davon täuschen.
Was „Halluzination” eigentlich bedeutet
In der KI-Welt ist eine „Halluzination”, wenn ein Chatbot etwas produziert, das wahr klingt, aber es nicht ist: eine erfundene Statistik, eine erdachte Quelle, eine selbstbewusst falsche Antwort. Das Wort lässt es exotisch klingen, doch die Alltagsversion ist einfach: Die KI füllt eine Wissenslücke mit einer überzeugenden Vermutung und präsentiert sie als Tatsache.
Das Knifflige ist der Tonfall. Ein Mensch, der etwas nicht weiß, zögert, relativiert oder gibt es zu. Eine KI liefert ihre Erfindung mit genau derselben ruhigen Überzeugung, die sie für Dinge nutzt, die sie richtig macht. Es gibt kein nervöses „ähm, ich glaube?”, und genau deshalb tappen Menschen in die Falle.
Warum passiert das also?
Um das zu verstehen, musst du wissen, was ein Chatbot unter der Haube wirklich tut. Er schlägt keine Fakten in einer Datenbank nach. Er ist eine spektakulär gute Vorhersagemaschine: Er liest deine Frage und ermittelt Wort für Wort, wonach eine sinnvolle Antwort wahrscheinlich klingt, basierend auf Mustern, die er aus einem riesigen Berg an Text gelernt hat.
Das ist brillant, um eine E-Mail zu schreiben oder eine Idee zu erklären. Aber es bedeutet, dass die KI der Plausibilität nachjagt, nicht der Wahrheit. Wenn sie die Antwort kennt, sind die plausibelsten nächsten Wörter zufällig korrekt. Wenn sie es nicht weiß, sind die am plausibelsten klingenden Wörter vielleicht eine wunderschön formulierte Erfindung. Die Maschine kann nicht immer unterscheiden, was was ist: Für sie sehen beide einfach aus wie „eine gute Antwort”.
| Was du glaubst, dass die KI tut | Was sie tatsächlich tut |
|---|---|
| Sie schlägt einen Fakt nach und gibt ihn wieder | Sie sagt die wahrscheinlichst klingenden Wörter voraus |
| Sie weiß, wann sie etwas nicht weiß | Sie kann oft eine Vermutung nicht von einem Fakt unterscheiden |
| Sie schweigt, wenn sie unsicher ist | Sie füllt die Lücke mit etwas Plausiblem |
| Sie zitiert echte Quellen | Sie kann Quellen erfinden, die echt aussehen |
Die Wendung: KI wird darauf trainiert zu raten
Hier kommt der Teil, der sogar die Fachleute überraschte. In einem Forschungspapier von 2025 erklärte OpenAI, dass Halluzinationen nicht bloß eine Panne sind: Sie sind teils dadurch eingebaut, wie KI während des Trainings bewertet wird.
Denk an einen Schüler in einer Multiple-Choice-Prüfung. Wenn eine falsche Antwort und eine leere beide null Punkte bringen, aber eine Glücksvermutung einen Punkt bringen kann, ist der kluge Zug immer, zu raten. KI-Modelle werden ganz ähnlich getestet: Die Bewertung belohnt eine selbstbewusste Antwort und bestraft das „ich weiß es nicht”, selbst wenn Nichtwissen die ehrliche, korrekte Antwort ist. Also lernen die Modelle zu bluffen. OpenAIs vorgeschlagene Lösung ist, zu ändern, wie wir sie bewerten, sodass das Eingestehen von Unsicherheit belohnt statt bestraft wird.
Das ist nicht nur theoretisch: es hat echte Kosten
Erfundene Antworten haben bereits echten Ärger verursacht:
- 2023 nutzten zwei New Yorker Anwälte ChatGPT, um einen Schriftsatz mitzuverfassen, und reichten ihn mit sechs Gerichtsfällen ein, die es nicht gab: Die KI hatte die Namen, Zitate und Quellenangaben erfunden. Ein Richter verhängte gegen sie eine Geldstrafe von 5.000 Dollar.
- 2024 verpflichtete ein kanadisches Gericht Air Canada dazu, eine Rückerstattungsregel einzuhalten, die ihr eigener Support-Chatbot beim Frage eines trauernden Kunden zu Trauertarifen einfach erfunden hatte. Die Fluggesellschaft argumentierte, der Bot sei für sich selbst verantwortlich; das Gericht sah das anders.
Die Lehre aus beiden Fällen: Die Überzeugung einer KI ist kein Beweis. Bei allem, was wirklich zählt (rechtlich, medizinisch, finanziell oder „ich bin gleich dabei, Leuten zu sagen, dass das stimmt”), gilt: überprüfen.
Manche KIs erfinden mehr als andere
Halluzination ist nicht überall gleich schlimm. Unabhängige Tests, die messen, wie oft ein Modell bei den Fakten einer ihm gegebenen Quelle bleibt, zeigen echte, mitunter große Unterschiede zwischen Modellen, und die neueren „denkenden” Modelle, die vor dem Antworten innehalten und überlegen, sind tendenziell genauer als die alten Sofort-Antwort-Modelle.
Das ist einer der Gründe, sich nicht auf einen einzigen Chatbot festzulegen. Wenn eine Antwort wichtig oder überraschend wirkt, ist es eine der schnellsten Plausibilitätsprüfungen überhaupt, dieselbe Frage einem zweiten Modell zu stellen: Wenn zwei verschiedene KIs, gebaut von verschiedenen Unternehmen, unabhängig voneinander übereinstimmen, kannst du dem viel mehr trauen als einer einzelnen selbstbewussten Stimme.
Wie du verlässliche Antworten bekommst
Du musst Halluzinationen nicht fürchten: Du brauchst nur ein paar Gewohnheiten, die im Hintergrund die Chancen zu deinen Gunsten verschieben:
- Frag nach den Quellen. „Woher hast du das? Gib mir Links, die ich überprüfen kann.” Wenn es auf nichts Echtes verweisen kann, behandle die Aussage als Vermutung.
- Gib ihr die Fakten zum Arbeiten. Modelle halluzinieren weit weniger, wenn sie über ein Dokument antworten, das du bereitstellst, statt aus dem Gedächtnis. Füge den Text ein, oder nutze ein Tool, mit dem du mit einem PDF chatten kannst, sodass die Antwort an eine echte Quelle gebunden ist.
- Prüfe mit einem zweiten Modell gegen. Stelle dieselbe Frage einer anderen KI. Übereinstimmung beruhigt; Uneinigkeit ist ein Signal, tiefer zu graben.
- Nutze ein Reasoning-Modell für schwere Fragen. Modelle, die vor dem Antworten nachdenken, sind bei kniffligen Dingen messbar genauer (wenn auch noch nicht perfekt).
- Gib ihr einen Ausweg. Füge „sag ‚ich weiß es nicht’, wenn du dir nicht sicher bist” zu deinem Prompt hinzu. Sie wird nicht immer gehorchen, aber es reduziert selbstbewussten Unsinn merklich.
Willst du den Gegenprüf-Trick gleich jetzt ausprobieren? Öffne dieselbe Frage in ein paar Modellen und vergleiche ihre Antworten:
Das Fazit
KI-Halluzinationen sind kein Zeichen dafür, dass die Technologie kaputt ist: Sie sind ein Nebeneffekt dessen, was sie überhaupt erst so nützlich macht: eine Maschine, die erstaunlich gut darin ist, flüssige, plausible Sprache zu produzieren. Die Lösung ist nicht, der KI zu misstrauen, sondern sie klug zu nutzen: frag nach Quellen, verankere sie in echten Dokumenten und lass nie eine einzelne selbstbewusste Stimme dein einziger Zeuge sein.
Das einfachste Sicherheitsnetz von allen ist eine zweite Meinung. Stelle deine Frage und stelle sie dann erneut einem anderen Modell und sieh, ob sie übereinstimmen: genau das kannst du kostenlos in Chatday tun, wo Claude, GPT-5.5, Gemini und mehr nebeneinander wohnen.