مقارنة النماذج مقارنة نماذج الصور أدوات الذكاء الاصطناعي النماذج نماذج الصور أخبار الذكاء الاصطناعي البحث جرّب مجانًا
كيف يعمل الذكاء الاصطناعي 7 دقائق قراءة

لماذا يختلق الذكاء الاصطناعي الأمور بثقة

بقلم Chatday Editorial Team ·

الذكاء الاصطناعيشرحالهلوسةكيف-يعمل
لماذا يختلق الذكاء الاصطناعي الأمور بثقة

اطرح على روبوت ذكاء اصطناعي سؤالاً لا يعرف إجابته، وإليك الجزء المقلق: فهو لا يقول تقريباً أبداً «لست متأكداً». بل غالباً ما يقدّم لك إجابة واثقة ومصقولة ومختلقة تماماً: عنوان كتاب وهمي، اقتباس لم يقله أحد، قانون لا وجود له. الذكاء الاصطناعي لا يكذب عن قصد. هو حقاً لا يميّز الفرق. وبمجرد أن تفهم لماذا يحدث ذلك، لن تنخدع به مرة أخرى أبداً.

ماذا تعني «الهلوسة» فعلاً

في عالم الذكاء الاصطناعي، تحدث «الهلوسة» عندما ينتج الروبوت شيئاً يبدو صحيحاً لكنه ليس كذلك: إحصائية مفبركة، مصدر مختلق، إجابة خاطئة لكن واثقة. الكلمة تجعل الأمر يبدو غريباً، لكن النسخة اليومية منه بسيطة: يملأ الذكاء الاصطناعي ثغرة في معرفته بتخمين مقنع ويقدّمه على أنه حقيقة.

الأمر الخادع هو النبرة. الإنسان الذي لا يعرف شيئاً ما عادةً يتردد أو يتحفّظ أو يعترف. أما الذكاء الاصطناعي فيقدّم اختلاقه بالثقة الهادئة نفسها التي يستخدمها مع الأمور التي يصيب فيها. لا يوجد «إيه، أظن؟» متوتر، وهذا بالضبط سبب وقوع الناس في الفخ.

إذن لماذا يحدث ذلك؟

لتفهم هذا، عليك أن تعرف ما يفعله الروبوت حقاً في الخلفية. إنه لا يبحث عن الحقائق في قاعدة بيانات. إنه آلة تنبؤ بارعة بشكل مذهل، تقرأ سؤالك وتحسب، كلمة بكلمة، كيف من المرجح أن تبدو الإجابة المعقولة، استناداً إلى أنماط تعلّمها من كمٍّ هائل من النصوص.

هذا رائع لكتابة بريد إلكتروني أو شرح فكرة. لكنه يعني أن الذكاء الاصطناعي يلاحق المعقولية، لا الحقيقة. عندما يعرف الإجابة، تصادف أن تكون أكثر الكلمات معقوليةً هي الصحيحة. وعندما لا يعرف، قد تكون الكلمات الأكثر معقوليةً في ظاهرها خيالاً مصاغاً بأناقة. الآلة لا تستطيع دائماً التمييز بين الاثنين، فبالنسبة لها، كلاهما يبدو مجرد «إجابة جيدة».

ما تفترض أن الذكاء الاصطناعي يفعلهما يفعله فعلاً
يبحث عن حقيقة ويبلّغ بهايتنبأ بالكلمات التي تبدو الأكثر احتمالاً
يعرف متى لا يعرفغالباً لا يميّز التخمين من الحقيقة
يصمت عند عدم اليقينيملأ الثغرة بشيء معقول
يقتبس مصادر حقيقيةقد يختلق مصادر تبدو حقيقية

المفاجأة: الذكاء الاصطناعي يُدرَّب على التخمين

إليك الجزء الذي فاجأ حتى الخبراء. في ورقة بحثية عام 2025، شرحت OpenAI أن الهلوسة ليست مجرد خلل، بل هي مدمجة جزئياً بسبب طريقة تقييم الذكاء الاصطناعي أثناء التدريب.

فكّر في طالب يخوض اختباراً متعدد الخيارات. إذا كانت الإجابة الخاطئة والإجابة الفارغة كلتاهما تساويان صفراً، لكن التخمين المحظوظ قد يمنح نقطة، فالخطوة الذكية هي التخمين دائماً. تُختبر نماذج الذكاء الاصطناعي بالطريقة نفسها تقريباً: يكافئ التقييم الإجابة الواثقة ويعاقب «لا أعرف»، حتى عندما يكون عدم المعرفة هو الجواب الصادق والصحيح. لذا تتعلّم النماذج أن تخادع. الحل الذي تقترحه OpenAI هو تغيير طريقة تقييمنا لها، بحيث يُكافأ الاعتراف بعدم اليقين بدلاً من أن يُعاقَب.

هذا ليس نظرياً فحسب: له تكاليف حقيقية

الإجابات المختلقة سبّبت بالفعل مشكلات حقيقية:

  • في عام 2023، استخدم محاميان من نيويورك ChatGPT للمساعدة في كتابة مذكرة قانونية وقدّماها وفيها ست قضايا محكمة لا وجود لها، فقد كان الذكاء الاصطناعي قد اختلق الأسماء والاقتباسات والاستشهادات. وغرّمهما القاضي 5,000 دولار.
  • في عام 2024، أمرت محكمة كندية شركة Air Canada بالالتزام بسياسة استرداد كان روبوت الدعم الخاص بها قد اختلقها ببساطة عندما سأل عميل ثكلان عن أسعار تذاكر الحداد. احتجّت الشركة بأن الروبوت مسؤول عن نفسه؛ ورفضت المحكمة ذلك.

الدرس من كليهما: ثقة الذكاء الاصطناعي ليست دليلاً. لأي أمر مهم فعلاً (قانوني أو طبي أو مالي، أو «أنا على وشك أن أخبر الناس بأن هذا صحيح») تحقّق.

بعض أنظمة الذكاء الاصطناعي تختلق أكثر من غيرها

الهلوسة ليست بالسوء نفسه في كل الحالات. الاختبارات المستقلة التي تقيس مدى تمسّك النموذج بحقائق المصدر المعطى له تُظهر فجوات حقيقية، وأحياناً كبيرة، بين النماذج. والنماذج «المفكِّرة» الأحدث، التي تتوقف لتفكّر قبل الإجابة، تميل إلى أن تكون أدقّ من النماذج الأقدم سريعة الردّ.

وهذا أحد أسباب عدم التشبّث بروبوت واحد. إذا بدت لك إجابةٌ مهمة أو مفاجئة، فطرح السؤال نفسه على نموذج ثانٍ هو من أسرع فحوص المنطقية الممكنة، فإذا اتفق ذكاءان اصطناعيان مختلفان، بُنيا على يد شركتين مختلفتين، بشكل مستقل، فيمكنك أن تثق بذلك أكثر بكثير من صوت واثق واحد بمفرده.

كيف تحصل على إجابات يمكنك الوثوق بها

لا داعي للخوف من الهلوسة، تحتاج فقط إلى بضع عادات تميل الكفّة لصالحك بهدوء:

  1. اطلب مصادره. «من أين أتيت بهذا؟ أعطني روابط يمكنني التحقق منها.» إن لم يستطع الإشارة إلى أي شيء حقيقي، فعامل الادعاء على أنه تخمين.
  2. زوّده بالحقائق ليعمل عليها. تهلوس النماذج بدرجة أقل بكثير عندما تجيب عن مستند تقدّمه أنت بدلاً من الإجابة من الذاكرة. الصق النص، أو استخدم أداة تتيح لك التحدث مع ملف PDF كي تكون الإجابة مثبَّتة على مصدر حقيقي.
  3. قارن مع نموذج ثانٍ. اطرح السؤال نفسه على ذكاء اصطناعي آخر. الاتفاق مطمئن؛ والاختلاف إشارة للتعمّق أكثر.
  4. استخدم نموذج تفكير للأسئلة الصعبة. النماذج التي تفكّر قبل أن تجيب أدقّ بشكل قابل للقياس في الأمور الشائكة (وإن لم تكن مثالية بعد).
  5. امنحه مخرجاً. أضف «قل ‘لا أعرف’ إن لم تكن متأكداً» إلى طلبك. لن يطيع دائماً، لكنه يقلّل بشكل ملحوظ من الهراء الواثق.

أتريد تجربة حيلة المقارنة الآن؟ افتح السؤال نفسه في نموذجين واقارن إجاباتهما:

لأنها تتنبأ بنصٍّ يبدو معقولاً بدلاً من البحث عن الحقائق. وعندما تصطدم بثغرة في معرفتها، تملؤها بتخمين مقنع بدلاً من الاعتراف بأنها لا تعرف.
وجد بحث لـ OpenAI أن طريقة تقييم النماذج أثناء التدريب تكافئ التخمين الواثق وتعاقب عدم اليقين، لذا تتعلّم المخادعة. والنماذج الأحدث تتحسّن ببطء في الاعتراف بالشك.
نعم. تُظهر الاختبارات المستقلة فجوات حقيقية بين النماذج في مدى تمسّكها بالحقائق، ونماذج التفكير التي 'تفكّر' قبل الردّ تميل إلى أن تكون أدقّ.
لا يمكنك منعها تماماً، لكن يمكنك تقليل الخطر كثيراً: اطلب المصادر، زوّده بالمستند ليعمل عليه، قارن مع نموذج ثانٍ، واطلب منه قول 'لا أعرف' عند عدم اليقين.
عامله كمساعد سريع وذكي تتحقق من عمله، لا كمرجع نهائي. وللأسئلة القانونية أو الطبية أو المالية، أكّد دائماً مع مصدر حقيقي أو مختصّ.

الخلاصة

هلوسات الذكاء الاصطناعي ليست دليلاً على أن التقنية معطّلة، بل هي أثر جانبي لما يجعلها مفيدة إلى هذا الحدّ أساساً: آلة بارعة بشكل مذهل في إنتاج لغة سلسة ومعقولة. الحل ليس في عدم الثقة بالذكاء الاصطناعي، بل في استخدامه بحكمة: اطلب المصادر، ثبّته على مستندات حقيقية، ولا تدع صوتاً واثقاً واحداً يكون شاهدك الوحيد.

أبسط شبكة أمان على الإطلاق هي الرأي الثاني. اطرح سؤالك، ثم اطرحه مجدداً على نموذج آخر وانظر إن اتفقا، يمكنك فعل ذلك بالضبط، مجاناً، في Chatday، حيث يعيش Claude وGPT-5.5 وGemini وغيرهم جنباً إلى جنب.