Modelle vergleichen Bildmodelle vergleichen KI-Tools Modelle KI-Bildmodelle KI-News Suchen Kostenlos testen
Wie KI funktioniert 7 Min. Lesezeit

Warum KI selbstbewusst Dinge erfindet

Von Chatday Editorial Team ·

kierklärthalluzinationenwie-es-funktioniert
Warum KI selbstbewusst Dinge erfindet

Stelle einem KI-Chatbot eine Frage, deren Antwort er nicht kennt, und hier kommt der beunruhigende Teil: Er sagt fast nie „ich bin mir nicht sicher”. Stattdessen liefert er dir oft eine selbstbewusste, ausgefeilte, vollständig erfundene Antwort: einen falschen Buchtitel, ein Zitat, das niemand gesagt hat, ein Gesetz, das es gar nicht gibt. Die KI lügt nicht absichtlich. Sie erkennt schlicht den Unterschied nicht. Und sobald du verstehst, warum das passiert, lässt du dich nie wieder davon täuschen.

Was „Halluzination” eigentlich bedeutet

In der KI-Welt ist eine „Halluzination”, wenn ein Chatbot etwas produziert, das wahr klingt, aber es nicht ist: eine erfundene Statistik, eine erdachte Quelle, eine selbstbewusst falsche Antwort. Das Wort lässt es exotisch klingen, doch die Alltagsversion ist einfach: Die KI füllt eine Wissenslücke mit einer überzeugenden Vermutung und präsentiert sie als Tatsache.

Das Knifflige ist der Tonfall. Ein Mensch, der etwas nicht weiß, zögert, relativiert oder gibt es zu. Eine KI liefert ihre Erfindung mit genau derselben ruhigen Überzeugung, die sie für Dinge nutzt, die sie richtig macht. Es gibt kein nervöses „ähm, ich glaube?”, und genau deshalb tappen Menschen in die Falle.

Warum passiert das also?

Um das zu verstehen, musst du wissen, was ein Chatbot unter der Haube wirklich tut. Er schlägt keine Fakten in einer Datenbank nach. Er ist eine spektakulär gute Vorhersagemaschine: Er liest deine Frage und ermittelt Wort für Wort, wonach eine sinnvolle Antwort wahrscheinlich klingt, basierend auf Mustern, die er aus einem riesigen Berg an Text gelernt hat.

Das ist brillant, um eine E-Mail zu schreiben oder eine Idee zu erklären. Aber es bedeutet, dass die KI der Plausibilität nachjagt, nicht der Wahrheit. Wenn sie die Antwort kennt, sind die plausibelsten nächsten Wörter zufällig korrekt. Wenn sie es nicht weiß, sind die am plausibelsten klingenden Wörter vielleicht eine wunderschön formulierte Erfindung. Die Maschine kann nicht immer unterscheiden, was was ist: Für sie sehen beide einfach aus wie „eine gute Antwort”.

Was du glaubst, dass die KI tutWas sie tatsächlich tut
Sie schlägt einen Fakt nach und gibt ihn wiederSie sagt die wahrscheinlichst klingenden Wörter voraus
Sie weiß, wann sie etwas nicht weißSie kann oft eine Vermutung nicht von einem Fakt unterscheiden
Sie schweigt, wenn sie unsicher istSie füllt die Lücke mit etwas Plausiblem
Sie zitiert echte QuellenSie kann Quellen erfinden, die echt aussehen

Die Wendung: KI wird darauf trainiert zu raten

Hier kommt der Teil, der sogar die Fachleute überraschte. In einem Forschungspapier von 2025 erklärte OpenAI, dass Halluzinationen nicht bloß eine Panne sind: Sie sind teils dadurch eingebaut, wie KI während des Trainings bewertet wird.

Denk an einen Schüler in einer Multiple-Choice-Prüfung. Wenn eine falsche Antwort und eine leere beide null Punkte bringen, aber eine Glücksvermutung einen Punkt bringen kann, ist der kluge Zug immer, zu raten. KI-Modelle werden ganz ähnlich getestet: Die Bewertung belohnt eine selbstbewusste Antwort und bestraft das „ich weiß es nicht”, selbst wenn Nichtwissen die ehrliche, korrekte Antwort ist. Also lernen die Modelle zu bluffen. OpenAIs vorgeschlagene Lösung ist, zu ändern, wie wir sie bewerten, sodass das Eingestehen von Unsicherheit belohnt statt bestraft wird.

Das ist nicht nur theoretisch: es hat echte Kosten

Erfundene Antworten haben bereits echten Ärger verursacht:

  • 2023 nutzten zwei New Yorker Anwälte ChatGPT, um einen Schriftsatz mitzuverfassen, und reichten ihn mit sechs Gerichtsfällen ein, die es nicht gab: Die KI hatte die Namen, Zitate und Quellenangaben erfunden. Ein Richter verhängte gegen sie eine Geldstrafe von 5.000 Dollar.
  • 2024 verpflichtete ein kanadisches Gericht Air Canada dazu, eine Rückerstattungsregel einzuhalten, die ihr eigener Support-Chatbot beim Frage eines trauernden Kunden zu Trauertarifen einfach erfunden hatte. Die Fluggesellschaft argumentierte, der Bot sei für sich selbst verantwortlich; das Gericht sah das anders.

Die Lehre aus beiden Fällen: Die Überzeugung einer KI ist kein Beweis. Bei allem, was wirklich zählt (rechtlich, medizinisch, finanziell oder „ich bin gleich dabei, Leuten zu sagen, dass das stimmt”), gilt: überprüfen.

Manche KIs erfinden mehr als andere

Halluzination ist nicht überall gleich schlimm. Unabhängige Tests, die messen, wie oft ein Modell bei den Fakten einer ihm gegebenen Quelle bleibt, zeigen echte, mitunter große Unterschiede zwischen Modellen, und die neueren „denkenden” Modelle, die vor dem Antworten innehalten und überlegen, sind tendenziell genauer als die alten Sofort-Antwort-Modelle.

Das ist einer der Gründe, sich nicht auf einen einzigen Chatbot festzulegen. Wenn eine Antwort wichtig oder überraschend wirkt, ist es eine der schnellsten Plausibilitätsprüfungen überhaupt, dieselbe Frage einem zweiten Modell zu stellen: Wenn zwei verschiedene KIs, gebaut von verschiedenen Unternehmen, unabhängig voneinander übereinstimmen, kannst du dem viel mehr trauen als einer einzelnen selbstbewussten Stimme.

Wie du verlässliche Antworten bekommst

Du musst Halluzinationen nicht fürchten: Du brauchst nur ein paar Gewohnheiten, die im Hintergrund die Chancen zu deinen Gunsten verschieben:

  1. Frag nach den Quellen. „Woher hast du das? Gib mir Links, die ich überprüfen kann.” Wenn es auf nichts Echtes verweisen kann, behandle die Aussage als Vermutung.
  2. Gib ihr die Fakten zum Arbeiten. Modelle halluzinieren weit weniger, wenn sie über ein Dokument antworten, das du bereitstellst, statt aus dem Gedächtnis. Füge den Text ein, oder nutze ein Tool, mit dem du mit einem PDF chatten kannst, sodass die Antwort an eine echte Quelle gebunden ist.
  3. Prüfe mit einem zweiten Modell gegen. Stelle dieselbe Frage einer anderen KI. Übereinstimmung beruhigt; Uneinigkeit ist ein Signal, tiefer zu graben.
  4. Nutze ein Reasoning-Modell für schwere Fragen. Modelle, die vor dem Antworten nachdenken, sind bei kniffligen Dingen messbar genauer (wenn auch noch nicht perfekt).
  5. Gib ihr einen Ausweg. Füge „sag ‚ich weiß es nicht’, wenn du dir nicht sicher bist” zu deinem Prompt hinzu. Sie wird nicht immer gehorchen, aber es reduziert selbstbewussten Unsinn merklich.

Willst du den Gegenprüf-Trick gleich jetzt ausprobieren? Öffne dieselbe Frage in ein paar Modellen und vergleiche ihre Antworten:

Weil sie plausibel klingenden Text vorhersagen, statt Fakten nachzuschlagen. Wenn sie auf eine Wissenslücke stoßen, füllen sie sie mit einer überzeugenden Vermutung, statt zuzugeben, dass sie es nicht wissen.
Eine OpenAI-Studie ergab, dass die Art, wie Modelle während des Trainings bewertet werden, selbstbewusstes Raten belohnt und Unsicherheit bestraft, also lernen sie zu bluffen. Neuere Modelle werden langsam besser darin, Zweifel einzugestehen.
Ja. Unabhängige Tests zeigen echte Unterschiede zwischen Modellen darin, wie oft sie bei den Fakten bleiben, und Reasoning-Modelle, die vor dem Antworten ‚nachdenken', sind tendenziell genauer.
Ganz verhindern kannst du es nicht, aber das Risiko stark senken: frag nach Quellen, gib ihr das Dokument zum Arbeiten, prüfe mit einem zweiten Modell gegen und sag ihr, sie soll ‚ich weiß es nicht' sagen, wenn sie unsicher ist.
Behandle sie als schnellen, klugen Assistenten, dessen Arbeit du überprüfst, nicht als letzte Instanz. Bei rechtlichen, medizinischen oder finanziellen Fragen bestätige stets mit einer echten Quelle oder einer Fachperson.

Das Fazit

KI-Halluzinationen sind kein Zeichen dafür, dass die Technologie kaputt ist: Sie sind ein Nebeneffekt dessen, was sie überhaupt erst so nützlich macht: eine Maschine, die erstaunlich gut darin ist, flüssige, plausible Sprache zu produzieren. Die Lösung ist nicht, der KI zu misstrauen, sondern sie klug zu nutzen: frag nach Quellen, verankere sie in echten Dokumenten und lass nie eine einzelne selbstbewusste Stimme dein einziger Zeuge sein.

Das einfachste Sicherheitsnetz von allen ist eine zweite Meinung. Stelle deine Frage und stelle sie dann erneut einem anderen Modell und sieh, ob sie übereinstimmen: genau das kannst du kostenlos in Chatday tun, wo Claude, GPT-5.5, Gemini und mehr nebeneinander wohnen.