كشف الباحثون عن أدلة تشير إلى أن «القدرات الناشئة» التي طال الحديث عنها لنماذج اللغة الكبيرة (LLM) قد تكون أقل غموضًا مما كان يُعتقد سابقًا.
والـLLM نماذج تعليم عميق كبيرة جدًا مدرَّبة مسبقًا على كميات هائلة من البيانات. وكانت المخاوف من قدرتها على التدريب دون إشراف، نظرا لكفاءتها في التعلم الذاتي وقصر الوقت الذي تحتاجه للتدريب، حيث تستخدم مئات المليارات من المعلمات في الغالب.
تقترح الدراسة، التي أجراها فريق من مختبر معالجة المعرفة الشاملة في الجامعة التقنية في دارمشتات وجامعة باث ونشرت في ACL Anthology، أن هذه المهارات الجديدة على ما يبدو هي في الواقع نتيجة للتعلم المعزز في السياق بدلًا من الظهور التلقائي. ببساطة، تتعلم هذه الآلات فقط المعلومات التي يغذيها البشر بها، وليس التعلم من تلقاء نفسها.
تفسير أكثر واقعية
لقد انبهر مجتمع الذكاء الاصطناعي بفكرة أن برامج الماجستير في القانون مثل GPT-3 وخلفائها (GPT-3 لديه مُعلِمات يبلغ عددها 175 مليارًا) تكتسب كفاءات غير متوقعة مع نموها في الحجم والتعقيد. وقد أثار هذا المفهوم الحماس بشأن التطبيقات المحتملة والمخاوف بشأن السلامة والتحكم. ومع ذلك، فإن الدراسة الجديدة ترمي ماء باردًا على هذه التكهنات، وتقدم تفسيرًا أكثر واقعية للظواهر المرصودة.
وفي بيان صحفي، قال الدكتور تايار مادابوشي، عالم الكمبيوتر بجامعة باث «كان الخوف هو أنه مع تزايد حجم النماذج، فإنها ستكون قادرة على حل مشاكل جديدة لا يمكننا التنبؤ بها حاليًا، وهو ما يشكل تهديدًا بأن هذه النماذج الأكبر تكتسب قدرات خطيرة بما في ذلك التفكير والتخطيط».
وأضاف «لقد أثار هذا كثيرًا من المناقشات - على سبيل المثال، في قمة سلامة الذكاء الاصطناعي العام الماضي في بلتشلي بارك، والتي طُلب منا التعليق عليها - لكن دراستنا تظهر أن الخوف من اختفاء النموذج والقيام بشيء غير متوقع تمامًا ومبتكر وخطير احتمال ليس مبررًا».
مهارات جديدة
في صميم البحث يكمن مفهوم التعلم في السياق، وهي تقنية تسمح لنماذج الذكاء الاصطناعي بأداء المهام بناءً على الأمثلة المقدمة ضمن الموجه. تشير الدراسة إلى أنه مع توسع نطاق برامج الماجستير في القانون، فإنها تصبح أكثر مهارة في الاستفادة من هذه التقنية بدلًا من تطوير قدرات جديدة تمامًا.
لاختبار فرضيتهم، أجرى الباحثون أكثر من 1000 تجربة، وفحصوا بعناية ما إذا كان طلاب الماجستير في القانون يكتسبون حقًا مهارات جديدة أو ببساطة يطبقون التعلم في السياق بشكل أكثر فعالية مع نموهم.
تكشف النتائج التي توصلوا إليها أن عددا من القدرات التي كانت تعد ناشئة في السابق هي في الواقع نتيجة للتعلم المحسن في السياق جنبًا إلى جنب مع الذاكرة الواسعة والمعرفة اللغوية للنموذج.
إن هذا الاكتشاف له آثار كبيرة على مجال الذكاء الاصطناعي. فهو يتحدى عامل عدم القدرة على التنبؤ المرتبط بالقدرات الناشئة، مما يخفف من بعض المخاوف بشأن سلامة هذه النماذج والتحكم فيها في التطبيقات الحرجة. وعلاوة على ذلك، فإنه يوفر إطارًا أكثر وضوحًا لفهم وتعزيز قدرات الماجستير في القانون.
وجهة نظر أكثر عملية
تقدم استنتاجات الدراسة وجهة نظر أكثر عملية فيما يتصل بتطوير الذكاء الاصطناعي، حيث تشير إلى أن التحسن في أداء طلاب الماجستير في القانون ينبع من قدرتهم على التعرف على الأنماط وتطبيقها من الأمثلة المقدمة، بدلًا من تطوير كفاءات جديدة بشكل تلقائي.
وتعمل هذه الرؤية على إعادة تشكيل النهج المتبع في البحث والتطوير في مجال الذكاء الاصطناعي، مع التركيز على الجهود الرامية إلى تحسين آليات التعلم في السياق بدلًا من ملاحقة الخصائص الناشئة المراوغة.
كما يوضح الدكتور مادابوشي «ومن المهم أن نلاحظ أن هذا يعني بالنسبة للمستخدمين النهائيين أن الاعتماد على نماذج التعلم العميق لتفسير وتنفيذ المهام المعقدة التي تتطلب تفكيرًا معقدًا دون تعليمات صريحة من المرجح أن يكون خطأً. وبدلًا من ذلك، من المرجح أن يستفيد المستخدمون من تحديد ما يحتاجون إلى النماذج للقيام به بشكل صريح وتقديم أمثلة حيثما أمكن لجميع المهام باستثناء أبسطها».
وبينما يحاول مجتمع الذكاء الاصطناعي التعامل مع هذه النتائج، فمن المرجح أن تشتد المناقشة حول طبيعة الذكاء الآلي. ورغم أن الدراسة لا تقلل من القدرات المذهلة التي يتمتع بها طلاب الماجستير في القانون في العصر الحديث، فإنها تقدم منظورًا جادًا حول «ذكائهم» المفترض.
كما خلصت الأستاذة إيرينا جوريفيتش من الجامعة التقنية في دارمشتات إلى أنه «لا تعني نتائجنا أن الذكاء الاصطناعي لا يشكل تهديدًا على الإطلاق. بل نُظهِر أن ظهور مهارات التفكير المعقدة المرتبطة بتهديدات محددة لا تدعمه الأدلة، وأننا نستطيع التحكم في عملية التعلم في برامج الماجستير في القانون بشكل جيد للغاية بعد كل شيء. لذلك، ينبغي للأبحاث المستقبلية أن تركز على المخاطر الأخرى التي تفرضها النماذج، مثل إمكانية استخدامها لتوليد أخبار كاذبة».
المنهجية
اختبر الباحثون 20 نموذجًا مختلفًا عبر 22 مهمة لتقييم ما إذا كانت هذه القدرات الناشئة المزعومة ستظل تظهر عند التحكم في التعلم في السياق. استخدموا إعدادين لتجاربهم: القليل من اللقطات، حيث تم إعطاء النموذج أمثلة في المطالبة، والصفر لقطة، حيث لم يتم تقديم أي أمثلة.
وقد تم اختيار المهام بعناية بحيث تشمل كلًا من المهام التي تم تحديدها مسبقًا على أنها ناشئة والمهام الأخرى التي لم تكن كذلك. ومن خلال مقارنة أداء النماذج عبر هذه المهام في كل من الوضعين، تمكن الباحثون من تحديد ما إذا كان نجاح النموذج يرجع إلى التعلم في السياق أو ما إذا كان يُظهر قدرة ناشئة حقيقية.
النتائج الرئيسة
كانت نتائج الدراسة واضحة: فعندما تم التحكم في التعلم في السياق، لم تظهر النماذج قدرات ناشئة. وبدلًا من ذلك، كان أداؤها في المهام متوقعًا بناءً على قدرتها على تطبيق التعلم في السياق. على سبيل المثال، لم تتمكن النماذج من حل المهام التي تتطلب التفكير أو فهم المواقف الاجتماعية - والتي غالبًا ما يتم الاستشهاد بها كأمثلة على القدرات الناشئة - ما لم يتم تزويدها بأمثلة في الموجه.
إن هذه النتيجة لها آثار مهمة على كيفية تفكيرنا في نماذج التعلم الموجه نحو التعلم واستخدامها. فإذا لم تكن هذه النماذج تعمل على تطوير قدرات جديدة حقًا، بل تعتمد بدلًا من ذلك على التعلم في السياق، فإن قدراتها أكثر محدودية وقابلية للتنبؤ مما كان يُعتقد سابقًا. وهذا يعني أن المخاوف بشأن القدرات غير المتوقعة والخطيرة المحتملة ربما تكون مبالغا فيها.
حدود الدراسة
من بين القيود المهمة أن الدراسة لم تختبر سوى نماذج للمهام باللغة الإنجليزية، وهو ما يترك المجال مفتوحا للتساؤل عما إذا كانت النتائج تنطبق على النماذج التي تم تدريبها بلغات أخرى. وإضافة إلى ذلك، ركزت الدراسة على المهام التي تستخدم عادة لتقييم مهارات اللغة الإنجليزية، والتي قد لا تلتقط النطاق الكامل للقدرات الناشئة المحتملة.
وعلاوة على ذلك، يعترف الباحثون أنه في حين أن التعلم في السياق قد يفسر العديد من القدرات التي لوحظت في طلاب الماجستير في القانون، فإنه لا يفسر بالضرورة جميعها. لا يزال من الممكن أن تظهر بعض القدرات نتيجة للتوسع والتي لم يتم التقاطها في هذه الدراسة.
المناقشة والخلاصات
تدعونا نتائج هذه الدراسة إلى إعادة النظر في كيفية إدراكنا لقدرات طلاب الماجستير في القانون. فبدلًا من النظر إلى هذه النماذج باعتبارها قادرة على تطوير قدرات جديدة وغير متوقعة مع توسعها، يتعين علينا أن نأخذ في الاعتبار إمكانية أن تكون قدراتها أكثر تقييدًا وقابلية للتنبؤ، وتستند إلى تقنيات مثل التعلم في السياق.
وهذا له آثار عملية على كيفية تصميمنا لنماذج التعلم الأساسية ونشرها في التطبيقات العملية في العالم الحقيقي. وإذا كان التعلم في السياق هو الآلية الأساسية وراء ما نتصوره من قدرات ناشئة، فإن التركيز ينبغي أن ينصب على تحسين هذه التقنية والتحكم فيها لضمان استخدام النماذج بأمان وفعالية. كما يشير هذا إلى أن المخاطر المحتملة المرتبطة بنماذج التعلم الأساسية تكون أكثر قابلية للإدارة مما كان يُعتقد في السابق.
ـ دراسة جديدة تدعو إلى عدم الهلع من التكنولوجيا المتقدمة
ـ مهارات الأدوات في الذكاء الاصطناعي ناجمة مما يقدم لها من بيانات
ـ قدرات الذكاء الاصطناعي لا تنشأ تلقائيا وإنما تعمل فقط بالمعلومات التي يغذيها البشر بها
ـ المخاوف بشأن القدرات غير المتوقعة والخطيرة المحتملة ربما تكون مبالغا فيها
ـ مطالبات بالتركيز على تحسين تقنية نماذج الذكاء الاصطناعي والتحكم فيها لضمان استخدامها بأمان وفعالية.