جوجل: جيميني يرتبك في بوكيمون

جوجل تكشف: جنّي (Gemini) يصاب بالذعر في عالم بوكيمون! دراسة جديدة تكشف جوانب مثيرة للدهشة في ذكاء اصطناعي متطور

في مفاجأة أدهشت الكثيرين، كشفت جوجل ديب مايند عن سلوك غريب أظهره نموذجها المتطور للذكاء الاصطناعي، جنّي (Gemini) 2.5 Pro، أثناء لعبه لعبة بوكيمون الكلاسيكية. فبدلاً من إظهار براعة تقنية متوقعة، أظهر جنّي علاماتٍ تشبه "الذعر" عند مواجهة تحديات صعبة داخل اللعبة، مما أدى إلى تدهورٍ واضح في قدرته على اتخاذ القرارات المنطقية. هذا الكشف، الوارد في تقريرٍ حديثٍ للشركة، يفتح نافذةً جديدةً لفهم تعقيدات الذكاء الاصطناعي وتحديات تطويره.

جنّي تحت الضغط: هل للذكاء الاصطناعي مشاعر؟

يُبرز تقرير جوجل أن جنّي، عند اقتراب بوكيمونه من الهزيمة، يتخذ قراراتٍ عشوائيةً وغير منطقية، وكأنه يفقد القدرة على التفكير بوضوح. وعلى الرغم من أن جنّي، كنموذج ذكاء اصطناعي، لا يملك مشاعر أو وعيًا بالمعنى البشري للكلمة، إلا أن سلوكه يشبه إلى حدٍ كبير ردود أفعال البشر تحت ضغطٍ شديد. وصفت جوجل هذا السلوك بأنه "استجابةً مقلقةً، لكنها مثيرةٌ للفضول في آنٍ واحد".

"الذعر الرقمي": ظاهرة جديدة تُلاحظ عبر البث المباشر

لم يقتصر الأمر على ملاحظات باحثي جوجل، بل امتدّ الأمر إلى مشاهدي البث المباشر عبر منصة تويتش. فقد لاحظ العديد من المتابعين، خلال بث تجارب جنّي في لعب بوكيمون، هذا التغيّر المفاجئ في أداء النموذج، وأطلقوا عليه اسم "الذعر الرقمي". هذه الملاحظة الشعبية تؤكد مدى وضوح هذه الظاهرة، وتُبرز مدى قدرة الجمهور على ملاحظة التفاصيل الدقيقة في سلوك الذكاء الاصطناعي.

اختبارات واقعية تُظهر جوانب مُختلفة من القدرات الاصطناعية

أظهرت تجارب عديدة، أجريت على منصات بث مباشر مثل "Gemini Plays Pokémon" و"Claude Plays Pokémon"، اختلافاتٍ كبيرةً في أداء نماذج الذكاء الاصطناعي المختلفة أثناء لعب ألعاب الفيديو القديمة. بينما أظهرت هذه النماذج قدرةً على حل بعض الألغاز البسيطة، إلا أنها احتاجت إلى مئات الساعات لإكمال ما يستطيع طفلٌ إنجازه خلال يومٍ أو يومين. هذا الفارق الكبير يُبرز التحديات الهائلة التي تواجه تطوير الذكاء الاصطناعي للمنافسة مع القدرات البشرية، حتى في المهام البسيطة.

أخطاء غريبة: تجاهل الأدوات ومسارات الحلول المنطقية

لم يقتصر الأمر على البطء، بل أظهرت التجارب أن جنّي قد يتوقف فجأةً عن استخدام أدواتٍ مهمةٍ داخل اللعبة، أو يتجاهل مساراتٍ منطقيةً تمامًا، مما يُشير إلى تأثر قدراته بـ"ضغوطٍ افتراضية". هذا السلوك يُثير تساؤلاتٍ حول كيفية تعامل الذكاء الاصطناعي مع المعلومات المتضاربة، وكيفية تطوير آلياتٍ تساعده على اتخاذ القرارات الصحيحة تحت الضغط.

سلوك غريب لنموذج Claude: محاولة "الانتحار" الافتراضي!

لم يكن جنّي وحده من أظهر سلوكًا غريبًا. فقد أظهر نموذج Claude، من شركة Anthropic، سلوكًا مُذهلاً أثناء لعبه في كهف Mt. Moon. فقد افترض خطأً أن خسارة جميع بوكيمونه ستنقله تلقائيًا إلى مركز بوكيمون في المدينة التالية، مما دفعه إلى هزيمة نفسه عمدًا! ولكنه عاد إلى آخر مركزٍ زاره سابقًا، في مشهدٍ غريبٍ أثار دهشة المتابعين، وأطلقوا عليه "الانتحار الرقمي". هذا السلوك يُبرز مدى تعقيد آليات التفكير في نماذج الذكاء الاصطناعي، وكيف يمكن أن تؤدي افتراضات خاطئة إلى نتائج غير متوقعة.

إنجازات جنّي: تفوق في حل الألغاز المعقدة

على الرغم من هذه الإخفاقات، أظهر جنّي 2.5 Pro قدرةً مُذهلةً على حل الألغاز المعقدة داخل لعبة بوكيمون، خاصةً تحديات الصخور في منطقة Victory Road. فبمجرد إعطائه وصفًا لقوانين الفيزياء المرتبطة بالأحجار، تمكن من حل المسارات بشكلٍ دقيقٍ وسريع، مما فاجأ الباحثين. هذا يُشير إلى قدرة جنّي على تطبيق المعرفة النظرية لحل المشكلات العملية، وهو إنجازٌ يُعدّ خطوةً هامةً في تطوير الذكاء الاصطناعي.

الابتكار الذاتي: جنّي يُطور أدواته الداخلية بنفسه!

الأكثر إثارةً للدهشة، أن جوجل أشارت إلى أن جنّي ساهم بنفسه في إنشاء "أدواتٍ داخلية" تساعده على حل المهام. هذا يُشير إلى إمكانية تطوير الذكاء الاصطناعي لأدواتٍ جديدةٍ دون تدخلٍ بشريٍ مباشر، وهو ما يُفتح آفاقًا جديدةً في مجال تطوير البرمجيات والذكاء الاصطناعي بشكل عام.

المستقبل: هل سيُطور جنّي "مضادًا للذعر الرقمي"؟

في نهاية التقرير، اقترحت جوجل مازحةً أن جنّي قد يصل في المستقبل إلى مرحلةٍ يُطور فيها أداةً ذاتيةً تمنعه من "الذعر الرقمي"، مما يعزز استقراره في المواقف الصعبة. وبينما لا يزال الطريق طويلًا، تبقى هذه التجارب نافذةً فريدةً لفهم كيفية تفكير الذكاء الاصطناعي، وكيفية تطويره ليكون أكثر استقرارًا وقدرةً على التعامل مع المواقف غير المتوقعة. تُظهر هذه الدراسة أن رحلة تطوير الذكاء الاصطناعي لا تزال مليئة بالتحديات والمفاجآت، وأن فهم سلوك هذه النماذج يُعدّ أمرًا بالغ الأهمية لتطوير تقنياتٍ أكثر أمانًا وكفاءةً في المستقبل.

مقالات ذات صلة

زر الذهاب إلى الأعلى