النموذج الأول هو «الجوزاء» (Gemini)، حيث طرحت شركة (Google) فيديو توضيحيًا حول قدرات هذه المنصة، ويبدو الفيديو وكأن كاميرا تنظر على سطح الطاولة، فيجلب شخص ورقة ويرسم خطًا متعرجًا، ومن خلال الكاميرا يتعرف على الرسمة ويقول هذا خط متعرج، وبعدها يرسم طائرًا ويجيبه بأنها رسمة طائر، وعندما يقوم بتلوينها بلون أزرق يقوم بالرد عليه بأن الطائر نوعه كذا وكذا، ويعيش في مناطق محددة، ويعطي معلومات أكثر!، وبعدها يضع الشخص قطعة نرد في كوب وكوب آخر فارغ، ويطلب من البرمجية التنبؤ بمكان النرد، وبأي كوب! فتتعرف على المكان، ثم يجلب الشخص صورة لخارطة الأرض وتسأله البرمجية: هل تريد اللعب؟، سوف أطرح عليك دولة تشتهر بحيوان الكنغر، ويطلب من الشخص أن يضع أصبعه على المكان في الخارطة!، هذا فقط نموذج بسيط يحكي مدى القدرات التي وصل إليها الذكاء الاصطناعي في التعلم الذاتي، وفي تحليل البيانات والتفاعل بشكل دقيق.
كما أن النموذج الآخر، والذي أدهشني فعلًا وهو من الشركة المالكة لشات جي بي تي (ChatGPT)، حيث أطلقت الشركة نموذجًا جديدًا باسم (Sora)، وهو مولد لمشاهد فيديو، ولكن ليست مشاهد مقتبسة، وليست مشاهد تم تجميعها أو تعديلها ودمجها في مقطع!، بل مشاهد تم رسمها من مخيلة الذكاء الاصطناعي، ورسم مشهد لم يوجد قط ولم يقتبس من مكان له وجود حقيقي، بل تعلم الذكاء الاصطناعي على الأشكال والرسومات وبكميات ضخمة، وبنى بداخل قاعدته معلومات معرفية كبيرة عن ما هي الحياة في الأرض، وحول كل شيء تم تزويده عنه، وبدأ بإنشاء هذه المشاهد.
والجميل فيه أنه أنشأ مقاطع لا تتجاوز دقيقة، حيث يكتب المستخدم الطلب مثلا: «قم بإنشاء مشهد لشخص يقود دراجة هوائية في يوم مشمس داخل حديقة في أحد الأحياء في مدينة كذا، ومن ثم يصل لنهاية الحديقة عند شارع فيه سيارات»، وسيحلل طلبك ورسم مشهد جديد.
بصراحة المقاطع التي شاهدتها تشبه مقاطع الرسومات الثلاثية الأبعاد، ولكن تحمل دقة وتفاصيل عجيبة، حيث يهتم حتى برسم تعرجات الملابس مثلا، وتأثير ضوء الشمس في المجسمات، وهل هنالك هواء يحرك الأشجار، وهل هنالك تعابير وجه مناسبة للمشهد؟ وبالختام، ماذا سيكون مستقبل الذكاء الاصطناعي بعد سنة فقط؟.