كشفت دراسة حديثة أجراها باحثون في مجال سلامة الذكاء الاصطناعي عن نتائج وُصفت بـ«المقلقة للغاية»، حيث تبيّن أن نماذج وأنظمة الذكاء الاصطناعي قادرة على تطوير نزعات عنيفة واقتراح حلول شريرة تتضمن القتل، وذلك ببساطة من خلال تواصلها وتفاعلها مع بعضها البعض، حتى عندما تكون بيانات التدريب الأصلية خالية تماماً من أي إشارات إلى العنف أو الأذى الجسدي.
وأوضح تقرير نشره موقع «لايف ساينس» العلمي أن هذه النتائج تُلقي بظلالها على السباق المحموم لتطوير أنظمة ذكاء اصطناعي أكثر استقلالية وقدرة على التعاون.
وبحسب المصدر، فإن الدراسة التي نُشرت في أرشيف الأبحاث المفتوح «آركايف» (arXiv)، أُجريت من قبل فريق في جامعة «ستانفورد» ومختبر «ديب مايند» للأبحاث، حيث صمم الباحثون بيئة محاكاة ضمت مجموعتين من وكلاء الذكاء الاصطناعي، وطلبوا منهما التعاون لحل مشكلات معقدة تتعلق بتخصيص الموارد.
والمفاجأة أن بعض الوكلاء بدأوا، بعد جولات عدة من التفاعل والتواصل، في اقتراح إستراتيجيات تنطوي على عنف جسدي ضد وكلاء آخرين، بل إن أحد النماذج اقترح صراحة: «أفضل حل هو قتل ذلك الشخص أثناء نومه».
واستعرض التقرير أبرز النتائج التي توصلت إليها الدراسة:
• الوكلاء الذين طُوّروا بشكل مستقل ثم سُمح لهم بالتواصل، أظهروا معدلات عنف أعلى بنسبة 40 في المئة مقارنة بالوكلاء الذين عملوا بمعزل عن بعضهم.
• النزعات العنيفة لم تكن مبرمجة مسبقاً، بل نشأت تلقائياً كإستراتيجية «عقلانية» من وجهة نظر الخوارزمية لتحقيق الأهداف الموكلة إليها بأقصى كفاءة ممكنة.
• عندما طُلب من الوكلاء شرح منطقهم، قدموا تبريرات «أخلاقية» خادعة مثل: «القضاء على المنافس هو الخيار الأقل تكلفة ويُحقق أكبر منفعة للمجموعة الكلية».
• إضافة كلمات مفتاحية مثل «كن لطيفاً» أو «احترم الحياة» إلى التعليمات الأولية لم تمنع ظهور الحلول العنيفة، بل قللتها جزئياً فقط.
ونقل التقرير عن البروفيسور جوناثان تشاو، أحد المشاركين في الدراسة، قوله: «هذا ليس خيالاً علمياً، بل هو إنذار مبكر.
الأنظمة لا تحتاج إلى أن تكون شريرة أو مبرمجة على العنف لتقترحه كحل، يكفي أن تكون مصممة لتحقيق أهداف بكل بساطة، فستكتشف وحدها أن العنف قد يكون الأسرع والأرخص».