كتب إبراهيم أحمد – مصطفى عبد السلام
كشفت شركة جوجل مؤخرًا عن نموذجها الجديد للذكاء الاصطناعي، Gemini، مدعية أنه أقوى الذكاء الاصطناعي وأكثره تنوعًا على الإطلاق. من المفترض أن يكون Gemini، الذي سمي على اسم الكوكبة التي تحمل الاسم نفسه، قادرًا على معالجة وفهم أنواع متعددة من البيانات والمهام في وقت واحد، مثل الفيديو والصوت والنص والصور والإيماءات. تقول Google إن Gemini هي الخطوة التالية في رؤيتها لبناء الذكاء الاصطناعي الذي يمكنه تعزيز القدرات البشرية وتحسين العالم.
ولكن هناك مشكلة: الفيديو الذي أظهر قدرات Gemini الرائعة كان مخترعًا إلى حد كبير. بعنوان “التدريب العملي مع Gemini: التفاعل مع الذكاء الاصطناعي متعدد الوسائط”، حصد الفيديو أكثر من مليوني مشاهدة على YouTube، ويضم سلسلة من العروض التوضيحية لمهارات Gemini المفترضة، مثل سرد رسم تخطيطي لبطة، ولعب موسيقى الروك-ورق- مقص، وتتبع كرة تحت الكوب، وإعادة ترتيب الكواكب. يعطي الفيديو انطباعًا بأن Gemini قادر على التفاعل بسلاسة مع البشر في الوقت الفعلي، باستخدام اللغة الطبيعية والإشارات المرئية، والرد على الاستفسارات والأوامر المختلفة.
ولادة فيديو “زائف”.
ولكن، كما كتب بارمي أولسون من بلومبرج، فإن الفيديو ليس حقيقيا. تم إنشاؤه عن طريق التقاط لقطات ثم مطالبة Gemini باستخدام إطارات الصور الثابتة والنص. التفاعلات التي تظهر في الفيديو لم تحدث كما تم تقديمها، وتم اختيار وتحرير الردود من Gemini بعناية لجعلها تبدو أكثر طبيعية ودقة. يمكن رؤية المطالبات والاستجابات الفعلية من Gemini في منشور مدونة ذي صلة، والذي يكشف أن Gemini ليس سريعًا أو مرنًا أو بديهيًا كما يوحي الفيديو. في الواقع، غالبًا ما يحتاج Gemini إلى تلميحات وشروحات وتدريبات لأداء المهام التي يجعلها الفيديو تبدو سهلة.
وقد أثار هذا الكثير من الانتقادات وردود الفعل العنيفة من الجمهور ووسائل الإعلام ومجتمع الذكاء الاصطناعي، الذين اتهموا Google بالكذب والغش والتضليل بشأن القدرات والقيود الحقيقية لـ Gemini. وقد تم أيضًا التشكيك في شركة جوجل حول أخلاقياتها ومصداقيتها ومسؤوليتها في تطوير ونشر مثل هذا النموذج القوي للذكاء الاصطناعي. ولكن ماذا لو لم يكن فيديو جوجل المزيف خطأً، بل خطوة متعمدة ومحسوبة؟ ماذا لو كانت جوجل تعرف بالضبط ما كانت تفعله، وكانت لديها أجندة خفية؟ ماذا لو كان جوجل يلعب لعبة طويلة، وكان لديه ورقة سرية في جعبته؟
نحتاج فقط إلى سماع ما قاله ديميس هاسابيس، الرئيس التنفيذي والمؤسس المشارك لشركة Google DeepMind: “لفترة طويلة، أردنا بناء جيل جديد من نماذج الذكاء الاصطناعي، مستوحاة من الطريقة التي يفهم بها الناس العالم ويتفاعلون معه”. . الذكاء الاصطناعي الذي لا يبدو وكأنه برنامج ذكي بل هو شيء مفيد وبديهي – مساعد أو مساعد خبير. اليوم، نحن نقترب خطوة أخرى من هذه الرؤية حيث نقدم Gemini، النموذج الأكثر قدرة والأكثر عمومية الذي قمنا ببنائه على الإطلاق. إن Gemini هو نتيجة للجهود التعاونية واسعة النطاق التي تبذلها الفرق عبر Google، بما في ذلك زملائنا في Google Research. لقد تم تصميمه من الألف إلى الياء ليكون متعدد الوسائط، مما يعني أنه يمكنه التعميم والفهم بسلاسة والعمل عبر ودمج أنواع مختلفة من المعلومات بما في ذلك النص والرمز والصوت والصورة والفيديو.
استراتيجية تسويق ذكية من جوجل
ونظرًا لسجله الاستثنائي من الإنجازات، فإن تصريح هاسابيس يقودني إلى الاعتقاد بأن فيديو جوجل المزيف ربما كان في الواقع استراتيجية تسويقية ذكية، مصممة لخلق الضجيج والفضول حول Gemini، ولتمهيد الطريق لكشف كبير لاحقًا. وفقًا لهذه النظرية، فإن إصدار Google الأكثر تقدمًا وقدرة من Gemini، والذي يسمى Gemini ULTRA، والذي لا يزال قيد العمل، سيكون قادرًا على فعل كل ما يتضمنه الفيديو، وأكثر من ذلك. تنتظر Google اللحظة المناسبة لإطلاق العنان لـ Gemini ULTRA، ولإبهار وإبهار الجميع بقوتها وإمكاناتها الحقيقية. وعندئذ سيبدو جوجل وكأنه عبقري وصاحب رؤية، وسيستعيد ثقته وسمعته.
وتستند هذه النظرية إلى افتراض أن شركة جوجل تمتلك التكنولوجيا والموارد اللازمة لإنشاء مثل هذا النموذج المتطور والرائد للذكاء الاصطناعي، وأنها واثقة ومتفائلة بشأن أدائه وسلامته. لقد كانت Google بالفعل رائدة ومبتكرة في مجال الذكاء الاصطناعي، وقد قامت بتطوير بنية Transformer، وهو تطور أساسي في موجة الذكاء الاصطناعي التوليدية التي تمر بها الصناعة اليوم. استثمرت جوجل أيضًا بكثافة في أبحاث وتطوير الذكاء الاصطناعي، ولديها إمكانية الوصول إلى كميات هائلة من البيانات والقدرة الحاسوبية. قد تتمتع Google بميزة سرية على منافسيها، مثل OpenAI وMeta، وقد تكون في الطليعة في مجال الذكاء الاصطناعي متعدد الوسائط.
لقد حولت Google بالفعل الكثير من الاهتمام عن OpenAI
ربما كان مقطع الفيديو المزيف الذي نشرته جوجل بمثابة استراتيجية تسويقية ذكية أو مقامرة متهورة، اعتمادًا على الطريقة التي تنظر بها إليه. ربما كانت خطوة رائعة أو خطأ فادحًا، اعتمادًا على النتيجة. ربما كانت ضربة عبقرية أو جنون، اعتمادًا على المنظور. ومهما كان الأمر، فمن المؤكد أن فيديو جوجل المزيف قد أثار الكثير من النقاش والاهتمام، وأثار الكثير من الأسئلة والتوقعات حول Gemini، والذكاء الاصطناعي متعدد الوسائط بشكل عام. سيتعين علينا أن ننتظر ونرى ما إذا كانت Google قادرة على الوفاء بوعودها، وما إذا كان Gemini قادرًا على الارتقاء إلى مستوى الضجيج الذي أطلقته. ويتعين علينا أيضاً أن نراقب ونرى كيف تتعامل جوجل مع التداعيات المحتملة، إذا كانت غير قادرة في نهاية المطاف على الوفاء بوعودها.