对比模型 对比图像模型 AI 工具 模型 AI 图像模型 AI 资讯 搜索 免费试用
AI 工作原理 7 分钟阅读

AI 为什么会自信地胡编乱造

作者 Chatday Editorial Team ·

aiexplainedhallucinationshow-it-works
AI 为什么会自信地胡编乱造

向 AI 聊天机器人提一个它不知道答案的问题,令人不安的地方就来了: 它几乎从不会说「我不确定」。相反,它常常会甩给你一个自信、流畅、 完全编造的答案:一本不存在的书名、一句没人说过的话、一条根本 不存在的法律。AI 并不是故意撒谎。它是真的分不清真假。而一旦你明白了 这背后为什么会发生,就再也不会被它骗到了。

「幻觉」究竟是什么意思

在 AI 圈里,「幻觉」指的是聊天机器人产出了听起来像真的、实际却不对的东西: 捏造的统计数据、虚构的来源、自信满满的错误答案。这个词听起来很玄乎,但它日常的样子 其实很简单:AI 用一个令人信服的猜测填补了自己知识上的空白,并把它当成事实抛出来。

棘手的地方在于语气。一个不懂某事的人通常会犹豫、含糊其辞,或者干脆承认。 而 AI 在抛出它的编造时,用的是和它答对时一模一样的平静自信。没有那种紧张的 「呃,我觉得吧?」,而这恰恰就是人们上当的原因。

那它为什么会这样?

要搞懂这一点,你得先知道聊天机器人在底层到底在干什么。它并不是在数据库里 查事实。它是一台极其出色的预测机器:它读你的问题,然后逐字逐句地 推算出,根据它从海量文本中学到的模式,一个合理的答案大概听起来是什么样。

这对于写邮件或解释一个概念来说棒极了。但这也意味着 AI 追求的是 合理性,而不是真相。当它知道答案时,最合理的下一个词恰好就是正确的。 而当它不知道时,听起来最合理的那些词,可能就是一段措辞优美的虚构。 这台机器并不总能分辨哪个是哪个,对它而言,两者看起来都只是「一个好答案」。

你以为 AI 在做什么它实际在做什么
查出一个事实并报告预测最像答案的那些词
知道自己什么时候不知道常常分不清猜测和事实
不确定时保持沉默用某个合理的东西填补空白
引用真实来源可能编造看起来很真的来源

转折点:AI 是被训练去瞎猜的

接下来这部分连专家都感到意外。在 2025 年的一篇研究论文中,OpenAI 解释说,幻觉不仅仅是个故障,它有一部分是被 AI 训练时的评分方式埋进去的。

想想一个学生在做选择题考试。如果答错和留空都是零分,但蒙对一个却可能得一分, 那么聪明的做法永远是去蒙。AI 模型受测的方式与此非常相似:评分会奖励自信的答案, 惩罚「我不知道」,哪怕承认不知道才是诚实、正确的回应。于是模型学会了 虚张声势。OpenAI 提出的解决办法,是改变我们给它们评分的方式, 让承认不确定得到奖励,而不是受到惩罚。

这不只是理论:它有真实的代价

编造的答案已经惹出了真实的麻烦:

  • 2023 年,纽约两名律师用 ChatGPT 帮忙撰写一份法律摘要,并把它连同 六个根本不存在的法庭判例一起提交了上去,这些案件的名称、引语和 引证都是 AI 编出来的。一位法官罚了他们 $5,000。
  • 2024 年,加拿大一个仲裁庭裁定,Air Canada 必须兑现一项退款政策, 而这项政策是它自己的客服机器人在一位丧亲的顾客咨询丧亲机票时凭空编造出来的。 这家航空公司辩称机器人应对自己负责;仲裁庭并不认同。

两件事给出的教训是一样的:AI 的自信不等于证据。对于任何真正重要的事: 法律、医疗、财务,或是「我正准备告诉别人这是真的」,你都要去核实。

有些 AI 比别的更爱胡编

幻觉的严重程度并非整齐划一。一些独立测试会衡量模型有多频繁地忠于 所给材料中的事实,结果显示不同模型之间存在真实、有时还相当大的差距, 而较新的「思考型」模型,会在回答前先停下来推理,往往比那些更老的即答型模型更准确。

这也是为什么不值得只认准一个聊天机器人。如果某个答案让你觉得重要或意外, 向第二个模型问同一个问题,是最快的靠谱性检查之一,如果两个由不同公司打造的 不同 AI 各自独立地给出一致答案,你就比只听一个自信的声音要可信得多。

如何得到可信的答案

你不必害怕幻觉,你只需要几个习惯,悄悄把胜算往自己这边压:

  1. 索要它的来源。「你从哪儿得来的?给我可以核查的链接。」如果它拿不出任何 真实的东西,就把这个说法当成猜测。
  2. **把事实喂给它。**当模型是基于你提供的文档作答、而不是凭记忆作答时, 它产生幻觉的概率要低得多。把文本粘进去,或者用一个能让你 与 PDF 对话的工具,让答案锚定在真实来源上。
  3. **用第二个模型交叉比对。**向另一个 AI 问同一个问题。一致让人安心; 不一致则是个该深挖的信号。
  4. **难题用推理模型。**那些在回答前先思考的 模型,在棘手的内容上明显更准确(虽然仍不完美)。
  5. **给它一个台阶下。**在你的提示里加上「如果不确定就说『我不知道』」。 它不会每次都照办,但能明显减少那些自信满满的胡话。

想现在就试试交叉比对这一招?把同一个问题在几个模型里打开, 对比一下它们的答案:

因为它们是在预测听起来合理的文本,而不是在查事实。一旦碰到知识上的空白,它们就会用一个令人信服的猜测把空白填上,而不愿承认自己不知道。
OpenAI 的研究发现,模型在训练时的评分方式会奖励自信的猜测、惩罚不确定,于是它们学会了虚张声势。较新的模型正在慢慢变得更愿意承认存疑。
是的。独立测试显示,不同模型在忠于事实的频率上存在真实差距,而那些在回答前先『思考』的推理模型往往更准确。
你没法彻底阻止它,但可以大幅降低风险:索要来源、把文档喂给它作答、用第二个模型交叉比对,以及在它不确定时让它说『我不知道』。
把它当成一个快速、聪明、但工作需要你来核实的助手,而不是最终权威。对于法律、医疗或财务问题,永远要用真实来源或专业人士确认。

结语

AI 幻觉并不意味着这项技术坏掉了,它是那个让 AI 如此有用的特性的副作用: 一台在产出流畅、合理的语言上好得惊人的机器。解决之道不是不信任 AI, 而是聪明地使用它:索要来源、把它锚定在真实文档上,永远别让一个自信的声音 成为你唯一的证人。

最省事的安全网,就是一个第二意见。问完你的问题,再向另一个模型问一遍, 看看它们是否一致,你完全可以免费这么做,就在 Chatday,那里 Claude、GPT-5.5、Gemini 等模型并肩而列。