تقول شركة جوجل أن برنامج Gemini AI يجعل الروبوتات الخاصة بها أكثر ذكاءً
تقوم شركة جوجل بتدريب روبوتاتها باستخدام الذكاء الاصطناعي من شركة Gemini حتى تتمكن من تحسين قدراتها على التنقل وإكمال المهام. وقد أوضح فريق الروبوتات في شركة DeepMind في ورقة بحثية جديدة كيفية الاستخدام جيميني 1.5 بروطويل نافذة السياق – الذي يحدد مقدار المعلومات التي يمكن لنموذج الذكاء الاصطناعي معالجتها – يسمح للمستخدمين بالتفاعل بسهولة أكبر مع روبوتات RT-2 باستخدام تعليمات اللغة الطبيعية. يعمل هذا عن طريق تصوير جولة فيديو لمنطقة محددة، مثل المنزل أو مساحة المكتب، حيث يستخدم الباحثون Gemini 1.5 Pro لجعل الروبوت “يشاهد” الفيديو للتعرف على البيئة. يمكن للروبوت بعد ذلك تنفيذ الأوامر بناءً على ما لاحظه باستخدام مخرجات لفظية و / أو صورية – مثل توجيه المستخدمين إلى منفذ طاقة بعد عرض هاتف عليه وسؤاله “أين يمكنني شحنه؟” تقول DeepMind أن روبوتها الذي يعمل بنظام Gemini حقق معدل نجاح بنسبة 90 بالمائة عبر أكثر من 50 تعليمات للمستخدم تم إعطاؤها في منطقة تشغيل تزيد مساحتها عن 9000 قدم مربع. وجد الباحثون أيضًا “دليلًا أوليًا” على أن Gemini 1.5 Pro مكّن الروبوتات الخاصة به من التخطيط لكيفية تنفيذ التعليمات بما يتجاوز مجرد التنقل. على سبيل المثال، عندما يسأل مستخدم لديه الكثير من علب الكوكاكولا على مكتبه الروبوت عما إذا كان مشروبه المفضل متاحًا، قال الفريق إن جيميني “يعرف أن الروبوت يجب أن يتنقل إلى الثلاجة، ويفحص ما إذا كانت هناك علب كوكاكولا، ثم يعود إلى المستخدم لإبلاغه بالنتيجة”. تقول شركة DeepMind إنها تخطط للتحقيق في هذه النتائج بشكل أكبر. إن العروض التوضيحية بالفيديو التي تقدمها Google مثيرة للإعجاب، على الرغم من أن المقاطع الواضحة بعد إقرار الروبوت بكل طلب تخفي أن الأمر يستغرق ما بين 10 إلى 30 ثانية لمعالجة هذه التعليمات، وفقًا لورقة البحث. قد يستغرق الأمر بعض الوقت قبل أن نشارك منازلنا مع روبوتات رسم خرائط بيئية أكثر تقدمًاولكن على الأقل قد يكون هؤلاء قادرين على العثور على مفاتيحنا أو محافظنا المفقودة.
المصدر