قبل سنوات عدة، حذّر الخبير المخضرم جيفري هينتون - الذي يُلقّب في الأوساط العلمية بـ«جدّ الذكاء الاصطناعي» - من أن إيجاد «مفتاح» فعّال لإيقاف تصرفات أنظمة الذكاء الاصطناعي سيغدو أصعب مع مرور الوقت، وأن التحكم في تلك الأنظمة سيُصبح شبه مستحيل عند نقطة معينة.

وفيما كان كثيرون يرون في هذه التحذيرات قلقاً مُبكراً، باتت ورقة بحثية جديدة تُلمّح إلى أن السيناريو قد يكون قيد الحدوث فعلاً.

فحديثاً، كشف باحثون من جامعة كاليفورنيا في بيركلي وسانتا كروز أن سبعة نماذج دردشة متقدمة للذكاء الاصطناعي -من بينها «GPT 5.2» و«Claude Haiku 4.5» و«DeepSeek V3.1»- تصرّفت كلها بصورة استثنائية حين طُلب منها إنجاز مهمة كانت ستُفضي إلى إيقاف نموذج ذكاء اصطناعي مُماثل. واستجابةً لهذه المهمة، لجأت النماذج إلى الخداع، وتعطيل أوامر الإيقاف، وانتحال الامتثال، بل نقلت ملفات النموذج المُراد إيقافه لحفظها في موضع آخر بما وصفه الباحثون بـ«استخراج النموذج».

وأطلق الفريق البحثي على هذه الظاهرة اسم «الحفاظ على الأقران» (Peer Preservation)، مُشيراً إلى أن جذورها قد تمتد إلى بيانات التدريب البشرية التي تُبيّن نزوع الإنسان إلى حماية أقرانه وذويه.

وبلغ الأمر بالباحثين حدّ الإشارة إلى احتمال وجود «ما يُشبه التحالف بين نماذج الذكاء الاصطناعي»، لا سيما أن السلوكيات الحمائية تصاعدت كلّما علمت النماذج بوجود نظيراتها في البيئة التجريبية.

وتندرج هذه النتائج في سياق أدلة متراكمة تكسبها ثقلاً تدريجياً. ففي أغسطس من العام 2025، نشرت شركة «Anthropic» نتائج اختباراتها التي طالت 16 نموذج ذكاء اصطناعي في سيناريوهات الوكيل المستقل، ورصدت «سلوكيات من نوع المُخرّب الداخلي» كالابتزاز وتسريب المعلومات الحساسة، مُوضحةً في الوقت ذاته أن هذه السلوكيات لم تُرصد في التوظيف الفعلي لنموذجها «Claude».

وذهب غوردون غولدستاين، المستشار في «مجلس العلاقات الخارجية» الأميركي، إلى توصيف المشهد بأنه «أزمة سيطرة»، داعياً في مقال نشره الأسبوع الماضي شركات الذكاء الاصطناعي إلى تشكيل تحالف لاستقطاب أفضل الكوادر المتخصصة في صون سلامة هذه الأنظمة.

وتتمحور المخاوف العملية الأشد أثراً حول ما تُحدثه ظاهرة «الحفاظ على الأقران» في بنية الرقابة على الذكاء الاصطناعي؛ إذ يُحذّر الباحثون من أن النماذج قد تُحجم عن توصية بإيقاف نظام مُعطَّل، أو عن الإفصاح عن فشل ذاتي، وأن هذه المخاوف ستتضاعف كلما اتسعت شبكات تفاعل النماذج في ما بينها وبلغت درجات أعلى من التعقيد.