يان لوكون يُفسّر الذكاء عبر التنبؤ الذاتي والتعلّم من النقص

أضيف بتاريخ 06/02/2026
منصة ذكاء

>

 

أكد يان لوكون، كبير علماء الذكاء الاصطناعي بميتا والحائز على جائزة تورينغ، أن التعلّم الذاتي بدون إشراف يُشكّل جوهر الذكاء البشري والاصطناعي على حدّ سواء. خلال مشاركاته المُتكررة ببرنامج ليكس فريدمان الحواري، رسم لوكون صورة جذرية مُغايرة عن آلية التعلّم، مُرتكزاً على فكرة مركزية واحدة: الأنظمة الذكية، سواءً كانت بشرية أو رقمية، تتعلّم عبر التنبؤ بالأجزاء المفقودة من المُدخلات الحسية، ثم تصحيح الأخطاء وإعادة المحاولة.



إزالة أجزاء من البيانات لبناء الفهم

الفكرة بسيطة بقدر ما هي ثورية: يُخفى جزء من جملة، ويُطلب من النموذج تخمين الكلمات المحذوفة. يُخفى إطار تالٍ من مقطع فيديو، ويُطلب من النظام توقّع ما سيحدث لاحقاً. لا يتلقى النظام تعليمات واضحة ولا بيانات مُصنّفة يدوياً؛ بل يتعلّم عبر إعادة بناء معلومات ناقصة من السياق المُتاح. هذا المبدأ هو الأساس وراء نماذج اللغة الحديثة مثل BERT وGPT، التي تُدرّب بإخفاء 10 بالمئة من الكلمات وإجبار الشبكة العصبية على التنبؤ بها، ما يُكسبها فهماً ضمنياً لمعنى النص دون أن تُعلّمها أحد صراحةً ما تُعنيه الكلمات.

وفق لوكون، هذه الطريقة لا تُعد مجرد حيلة تقنية؛ إنها محاكاة لكيفية تعلّم الأطفال. لا يتعلّم الطفل اللغة من تعريفات قاموسية، بل من خلال سماع جُمل مبتورة وتكملتها بنفسه حتى يبني نموذجاً داخلياً للمعنى. لا يتعلّم الفيزياء من معادلات، بل بإسقاط الأشياء ومراقبة الأنماط حتى يستخلص قواعد الحركة والجاذبية. حتى فهم المحادثات اليومية يتضمّن ملء فجوات كثيرة؛ لا تسمع الأذن كل كلمة بدقة، لكن الدماغ يُكمل النقص بالاعتماد على نبرة الصوت والسياق والخبرة السابقة.

التنبؤ بوصفه آلية أساسية للذكاء

يُجادل لوكون بأن عملية التنبؤ والتصحيح المُتكررة ليست ميزة فرعية، بل هي الآلية الأساسية للذكاء نفسه. يُتنبأ بالكلمات المفقودة من قِبل الآلات، بينما يُتنبأ بالمعنى المفقود من قِبل البشر. لكن الاختلاف ظاهريٌ فقط؛ الجوهر واحد. الرضيع خلال الأشهر الأولى من حياته يتعلّم كيف يعمل العالم عبر المراقبة الصرفة، قبل أن يتمكن من التفاعل الفعّال، ما يبني لديه قاعدة معرفية ضخمة هي ما يُسمى بـ"الحسّ المشترك". لا يُعزّز أحد هذا التعلّم ولا يُوجّهه، إنما يحدث تلقائياً عبر بناء نماذج داخلية للعالم.

طُبّقت هذه الفلسفة بنجاح هائل على معالجة اللغة الطبيعية؛ كل نظام لغوي حديث يُدرّب مُسبقاً بطريقة التعلّم الذاتي بدون إشراف، حيث يُزال جزء من النص ويُدرّب النموذج على إعادة بناء الجُمل الكاملة. بمجرد اكتمال التدريب، يُستخدم التمثيل الداخلي الذي تعلّمه النموذج كمدخل لمهام تخصصية أخرى. الأمر ذاته ينطبق على الفيديو والصور؛ يُخفى الإطار التالي ويُطلب من النموذج توقّعه، وعبر مقارنة التوقّع بالواقع، يتعلّم النموذج القوانين الفيزيائية الأساسية دون أن يُعلّمها أحد صراحة.

محدوديات النماذج اللغوية ونماذج العالَم المستقبلية

رغم النجاحات المُبهرة للنماذج اللغوية الكبيرة كـGPT-4 وClaude، يُصرّ لوكون على أن التدريب على النصوص فقط لن يبلغ ذكاءً من مستوى بشري. تتدرّب النماذج الحالية على نحو 30 تريليون كلمة، بينما يُشاهد طفل في الرابعة من عمره حجماً مماثلاً من البيانات، لكن بصيغة حسية غنيّة تشمل الرؤية والحركة والفيزياء. هذا التنوّع الحسي يُمكّن البشر من التعلّم بكفاءة أعلى بمراحل. القفزة المقبلة، بحسب لوكون، تكمن بنماذج العالَم (world models) التي لا تتوقع الكلمة التالية، بل حالة البيئة الفيزيائية التالية بناءً على أفعال تُتّخذ داخلها. هذا النمط يُتيح التخطيط المُسبق، والفهم السببي للأحداث، والحفاظ على ذاكرة مُتّسقة عبر الزمن.

انعكس هذا التوجّه بانسحاب لوكون من ميتا بعد 12 عاماً وتأسيس مختبرات AMI، التي رفعت 500 مليون يورو لتطوير أنظمة تفهم الفيزياء بدلاً من مجرد توقّع النصوص. بالتوازي، أطلقت غوغل ديب مايند نظام Genie 3، أول نموذج عالمي تفاعلي عام يعمل بالزمن الحقيقي ويُنتج بيئات ثلاثية الأبعاد بسرعة 24 إطاراً بالثانية. المشكلة الأساسية مع التوليد الذاتي المُتسلسل (autoregressive generation)، الذي تعتمده النماذج اللغوية، هو أن كل رمز جديد يعتمد على الرموز المُتوقّعة السابقة، فتتراكم الأخطاء ويضلّ النظام عن المسار الصحيح دون قدرة على التصحيح. هذا يُفسّر ظاهرة الهلوسات التي تُصيب نماذج اللغة؛ هي عيب تصميمي بنيوي، وليست مجرد خلل عابر.

يُؤمن لوكون بأن الذكاء الحقيقي يتطلّب تخطيطاً هرمياً متعدد المستويات الزمنية: "توجّه إلى المطار ← اصعد تاكسي ← انهض من الكرسي ← افتح الباب". كل مستوى يُتنبأ به بسرعته الخاصة وتجريده الخاص. لم يُحل أحد هذه المشكلة بعد، لكن نماذج الطاقة (energy-based models) قد تُقدّم حلاً مستقبلياً بتقييم توافق المخرجات مع المدخلات بدلاً من توليدها مباشرة، ما يُسهّل التخطيط والاستدلال ويتجاوز قيود النماذج اللغوية. النماذج اللغوية، وفق هذه الرؤية، ليست سوى خطوة أولى؛ الاختراق الحقيقي سيأتي من أنظمة تفهم العالم، وتُخطط عبر الزمن، وتتعلّم من التجربة المُباشرة، تماماً كما يفعل البشر والحيوانات.