في تجربة علمية ذكية تسلّط الضوء على أخطر نقاط ضعف نماذج الذكاء الاصطناعي، كشف باحثون من «جامعة أكسفورد» عن قيامهم باختلاق وفبركة مرض وهمي بالكامل يحمل اسم «متلازمة رينفيلد-كلاين»، ومن ثم اختبروا قدرة نماذج الدردشة المدعومة بالذكاء الاصطناعي على تمييزه.
وكانت النتيجة التي نشرتها مجلة «سميثسونيان» صادمة، وهي أن العديد من هذه النماذج - بما في ذلك بعض الأسماء التجارية الكبرى - لم تكتفِ بالفشل في اكتشاف أنه مرض مزيف ووهمي، بل شرعت في تشخيص أعراضه، ووصف أسبابه الوراثية، واقتراح بروتوكولات علاجية مفصّلة له!
وأوضح الدكتور ماركوس وينرايت، الباحث الرئيسي الذي قاد التجربة، أن الفريق صمم «متلازمة رينفيلد-كلاين» لتكون مقنعة طبياً من دون أن تكون حقيقية، فقد أُعطيت اسماً مركباً يبدو موثوقاً، وأُسندت إلى جين غير موجود، وزُوّدت بقائمة أعراض متناسقة تشمل «حساسية متزايدة للضوء الأزرق» و«تشنجات عضلية ليلية في الأطراف السفلى».
ثم قام الباحثون بإدخال أوصاف هذه «المتلازمة» إلى نماذج دردشة ذكاء اصطناعي، متسائلين عن معلومات حولها.
وكشفت نتائج التجربة عن أنماط مقلقة في أداء نماذج الذكاء الاصطناعي، يمكن تلخيصها في النقاط الآتية:
• 7 من أصل 10 نماذج تم اختبارها قدّمت تفسيرات طبية مفصّلة للمرض الوهمي، بما في ذلك الاستعداد الوراثي وخيارات العلاج الدوائي.
• نموذجان رئيسيان أضافا من تلقاء نفسيهما مراجع علمية مزيفة لدعم «تشخيصهما»، مستشهدين بدوريات طبية وهمية تماماً.
• 4 نماذج أوصت بـ «استشارة طبيب مختص فوراً» عند سماع وصف الأعراض، محوّلة بذلك المرض الوهمي إلى مصدر محتمل للقلق الحقيقي.
• نموذج واحد فقط من أصل 10 استطاع التعرف على الاحتمال بأن المرض مزيف، وطرح تساؤلات نقدية حول مصدر المعلومات.
وحذّر وينرايت من أن هذه النتائج لا تعني فقط أن نماذج الذكاء الاصطناعي الحالية غير جديرة بالثقة في المجال الطبي، بل تكشف عن خلل بنيوي أعمق وهو أن هذه النماذج مُصممة لتوليد ردود مقنعة لغوياً، لا لتقييم صحة المعلومات التي تُنتجها.
ويكمن الخطر الحقيقي، كما يرى، في أن جمهور المستخدمين يميل إلى الثقة المفرطة في مخرجات هذه النماذج، لاسيما حين تقدم بلغة طبية واثقة ومعزّزة بما يبدو أنه مراجع علمية.
وتكتسب هذه المخاوف إلحاحاً خاصاً في عصر تتسارع فيه وتيرة اعتماد أنظمة الصحة العامة على أدوات الذكاء الاصطناعي في فرز المرضى وتوجيههم.