يمكن للنماذج اللغوية الكبيرة أن تساعد الروبوتات المنزلية على التعافي من الأخطاء دون مساعدة بشرية
هناك أسباب لا حصر لها وراء عدم نجاح الروبوتات المنزلية بعد رومبا. لقد ساهم التسعير والتطبيق العملي وعامل الشكل ورسم الخرائط في الفشل تلو الآخر. وحتى عندما تتم معالجة بعض هذه الأمور أو جميعها، يظل السؤال قائمًا حول ما الذي يحدث عندما يرتكب النظام خطأً لا مفر منه.
وكانت هذه نقطة خلاف على المستوى الصناعي أيضا، ولكن الشركات الكبرى لديها الموارد اللازمة لمعالجة المشاكل بشكل صحيح عند ظهورها. ومع ذلك، لا يمكننا أن نتوقع من المستهلكين أن يتعلموا البرمجة أو توظيف شخص يمكنه المساعدة في أي وقت تظهر فيه مشكلة ما. لحسن الحظ، هذه حالة استخدام رائعة لـ LLMs (نماذج اللغات الكبيرة) في مجال الروبوتات، كما يتضح من بحث جديد من معهد ماساتشوستس للتكنولوجيا.
تهدف دراسة من المقرر تقديمها في المؤتمر الدولي لتمثيلات التعلم (ICLR) في شهر مايو إلى جلب القليل من “الحس السليم” إلى عملية تصحيح الأخطاء.
تشرح المدرسة قائلة: “اتضح أن الروبوتات مقلدة بشكل ممتاز”. “ولكن ما لم يبرمجها المهندسون أيضًا للتكيف مع كل عثرة أو دفعة محتملة، فإن الروبوتات لا تعرف بالضرورة كيفية التعامل مع هذه المواقف، باستثناء بدء مهمتها من الأعلى”.
تقليديًا، عندما تواجه الروبوتات مشكلات، فإنها تستنفد خياراتها المبرمجة مسبقًا قبل أن تتطلب التدخل البشري. تعد هذه مشكلة كبيرة بشكل خاص في بيئة غير منظمة مثل المنزل، حيث يمكن لأي عدد من التغييرات في الوضع الراهن أن يؤثر سلبًا على قدرة الروبوت على العمل.
لاحظ الباحثون القائمون على الدراسة أنه على الرغم من أن التعلم بالتقليد (تعلم القيام بمهمة ما من خلال الملاحظة) شائع في عالم الروبوتات المنزلية، إلا أنه في كثير من الأحيان لا يمكن أن يأخذ في الاعتبار التغيرات البيئية الصغيرة التي لا تعد ولا تحصى والتي يمكن أن تتداخل مع التشغيل المنتظم، وبالتالي يتطلب نظامًا. لإعادة التشغيل من المربع الأول. يعالج البحث الجديد هذا الأمر، جزئيًا، من خلال تقسيم المظاهرات إلى مجموعات فرعية أصغر، بدلاً من التعامل معها كجزء من عمل مستمر.
وهذا بدوره هو المكان الذي يدخل فيه حاملو شهادة LLM إلى الصورة، مما يلغي الحاجة إلى قيام المبرمج بتسمية وتعيين الإجراءات الفرعية العديدة بشكل فردي.
“لدى ماجستير إدارة الأعمال طريقة لإخبارك بكيفية القيام بكل خطوة من المهمة، باللغة الطبيعية. يقول طالب الدراسات العليا تسون هسوان وانغ: “إن العرض المستمر للإنسان هو تجسيد لتلك الخطوات في الفضاء المادي”. “وأردنا ربط الاثنين، حتى يعرف الروبوت تلقائيًا المرحلة التي وصل إليها في المهمة، ويكون قادرًا على إعادة التخطيط والتعافي من تلقاء نفسه.”
يتضمن العرض التوضيحي المحدد في الدراسة تدريب الروبوت على جمع الكرات الرخامية وصبها في وعاء فارغ. إنها مهمة بسيطة وقابلة للتكرار بالنسبة للبشر، ولكن بالنسبة للروبوتات، فهي عبارة عن مزيج من المهام الصغيرة المختلفة. إن LLMs قادرون على إدراج هذه المهام الفرعية وتصنيفها. وفي العروض التوضيحية، قام الباحثون بتخريب النشاط بطرق صغيرة، مثل إبعاد الروبوت عن مساره وإخراج الكرات الرخامية من ملعقته. استجاب النظام من خلال التصحيح الذاتي للمهام الصغيرة، بدلاً من البدء من الصفر.
ويضيف وانغ: “من خلال طريقتنا، عندما يرتكب الروبوت أخطاء، لا نحتاج إلى مطالبة البشر بالبرمجة أو تقديم عروض توضيحية إضافية حول كيفية التعافي من حالات الفشل”.
إنها طريقة مقنعة لمساعدة الشخص على تجنب فقدان رخامه تمامًا.
اكتشاف المزيد من مجلة كوكان
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.