«ديب سيك» الصينية تبدأ 2026 بطريقة تدريب ذكاء اصطناعي مبتكرة
افتتحت شركة «ديب سيك» الصينية الناشئة للذكاء الاصطناعي العام 2026 بنشر ورقة بحثية جديدة تصف طريقة لتدريب نماذج اللغة الكبيرة يمكن أن تشكل تطوراً للنماذج الأساسية، وفقاً للشركة.
وشارك في تأليف الورقة مؤسس الشركة ليانغ وينفينغ، وتقدم ما تسميه «ديب سيك» بـ «الروابط الفائقة المقيدة بالتشعب»، أو «إم إتش سي»، وهي طريقة تدريب مصممة لتوسيع نطاق النماذج من دون أن تصبح غير مستقرة أو تنهار تماماً.
وقال محللون لموقع «بيزنس إنسايدر» إن النهج يمثل اختراقاً مذهلاً.
ومع نمو نماذج اللغة، غالباً ما يحاول الباحثون تحسين الأداء من خلال السماح لأجزاء مختلفة من النموذج بمشاركة المزيد من المعلومات داخلياً، لكن هذا يزيد من خطر أن تصبح المعلومات غير مستقرة، وفقاً للورقة.
وتمكّن أحدث أبحاث «ديب سيك» النماذج من مشاركة اتصالات داخلية أكثر ثراء بطريقة مقيدة، مع الحفاظ على استقرار التدريب والكفاءة الحسابية حتى مع توسع النماذج.
وقالت المحللة الرئيسية للذكاء الاصطناعي في «كاونتربوينت ريسيرش»، واي صن، إن «النهج يمثل اختراقاً مذهلاً، إذ جمعت (ديب سيك) تقنيات مختلفة لتقليل التكلفة الإضافية لتدريب نموذج».
وأضافت «حتى مع زيادة طفيفة في التكلفة، يمكن أن تؤدي طريقة التدريب الجديدة إلى أداء أعلى بكثير».
وقالت واي صن إن «الورقة تُقرأ كبيان عن قدرات (ديب سيك) الداخلية»، مضيفة أن «الشركة يمكنها مرة أخرى تجاوز اختناقات الحوسبة وفتح قفزات في الذكاء، في إشارة إلى لحظة (سبوتنيك) في يناير 2025، عندما كشفت الشركة عن نموذج الاستدلال (آر 1)».
وهزّ الإطلاق صناعة التقنية وسوق الأسهم الأميركية، ما أظهر أن نموذج «آر 1» يمكن أن يضاهي أفضل المنافسين، مثل «أو 1» من «تشات جي بي تي»، بجزء بسيط من التكلفة.
وقال ليان جيي سو، كبير المحللين في شركة الأبحاث والاستشارات التقنية (أومديا) إن «البحث المنشور يمكن أن يكون له تأثير متموج عبر الصناعة، مع تطوير مختبرات الذكاء الاصطناعي المنافسة نسخها الخاصة من النهج». وأضاف أن «الاستعداد لمشاركة النتائج المهمة مع الصناعة مع الاستمرار في تقديم قيمة فريدة من خلال نماذج جديدة يُظهر ثقة جديدة في صناعة الذكاء الاصطناعي الصينية»، مشيراً إلى أن «الانفتاح يُعتنق كميزة إستراتيجية وعامل تمييز رئيسي».
وتأتي الورقة بينما تعمل «ديب سيك» على إصدار نموذجها الرئيسي التالي «آر 2»، بعد تأجيل سابق.
وكان من المتوقع إطلاق «آر 2» في منتصف العام 2025، لكنه تأخر بعد أن عبّر ليانغ عن عدم رضاه عن أداء النموذج، وفقاً لتقرير صدر في يونيو من «ذي إنفورميشن».
وأفاد التقرير بأن الإطلاق تعقّد أيضاً بسبب نقص الرقائق المتقدمة للذكاء الاصطناعي، وهو الأمر الذي شكّل بشكل متزايد كيفية تدريب المختبرات الصينية ونشر النماذج الأمامية.
وفي حين أن الورقة لا تذكر «آر 2»، فإن توقيتها أثار الدهشة.
ونشرت «ديب سيك» سابقاً بحثاً تدريبياً أساسياً قبل إطلاق نموذج «آر 1».
وقال سو إن سجل «ديب سيك» الحافل يشير إلى أن البنية الجديدة سيتم تنفيذها بالتأكيد في نموذجها الجديد.
ومن ناحية أخرى، تتوخى صن مزيداً من الحذر، قائلة إنه على الأرجح لن يأتي نموذج «آر 2» مستقل، وبما أن «ديب سيك» دمجت بالفعل تحديثات «آر 1» السابقة في نموذج «في 3»، فإن التقنية يمكن أن تشكل العمود الفقري لنموذج «في 4» من «ديب سيك».
وأجرت التجارب الموصوفة في الورقة على نماذج تتراوح من 3 مليارات إلى 27 مليار معامل.
ويعكس هذا البحث الجهود المتزايدة للصناعة الصينية للذكاء الاصطناعي للمنافسة مع أمثال «أوبن إيه آي» على الرغم من عدم الوصول الحر إلى رقائق «إنفيديا».
ووُصّفت الوثيقة بأنها مصممة لتحسين قابلية التوسع مع تقليل المتطلبات الحسابية والطاقة لتدريب أنظمة الذكاء الاصطناعي المتقدمة، وفقاً للمؤلفين. وتُظهر هذه الخطوة كيف أن القيود على الرقائق تشكل الجيل القادم من تطوير الذكاء الاصطناعي في الصين.