تقوم Covariant ببناء ChatGPT للروبوتات
المتغير هذا الأسبوع أعلنت عن إطلاق RFM-1 (نموذج مؤسسة الروبوتات 1). يقول بيتر تشين، المؤسس المشارك والرئيس التنفيذي لشركة UC Berkeley للذكاء الاصطناعي، لـ TechCrunch، إن المنصة “هي في الأساس نموذج لغة كبير (LLM)، ولكن للغة الروبوت”.
إن RFM-1 هو نتيجة، من بين أمور أخرى، لمجموعة هائلة من البيانات التي تم جمعها من نشر منصة Covariant’s Brain AI. بموافقة العميل، قامت الشركة الناشئة ببناء روبوت يعادل قاعدة بيانات LLM.
يقول تشين: “إن رؤية RFM-1 هي تزويد مليارات الروبوتات القادمة بالطاقة”. “لقد قمنا في Covariant بالفعل بنشر الكثير من الروبوتات في المستودعات بنجاح. لكن هذا ليس الحد الأقصى للمكان الذي نريد الوصول إليه. نريد حقًا تشغيل الروبوتات في التصنيع، وتجهيز الأغذية، وإعادة التدوير، والزراعة، وصناعة الخدمات، وحتى في منازل الناس.
يتم إطلاق المنصة في الوقت الذي تناقش فيه المزيد من شركات الروبوتات مستقبل أنظمة “الأغراض العامة”. وقد لعب الهجوم المفاجئ لشركات الروبوتات البشرية، مثل Agility وFiger و1X وApptronik، دورًا محوريًا في تلك المحادثة. إن عامل الشكل مناسب بشكل خاص للقدرة على التكيف (يشبه إلى حد كبير البشر الذين تم تصميمه على أساسهم)، على الرغم من أن قوة أنظمة الذكاء الاصطناعي/البرمجيات الموجودة على متن الطائرة هي مسألة أخرى تمامًا.
في الوقت الحالي، يتم نشر برنامج Covariant إلى حد كبير على الأذرع الآلية الصناعية التي تقوم بمجموعة متنوعة من مهام المستودعات المألوفة، بما في ذلك وظائف مثل التقاط الصناديق. ولا يتم نشره حاليًا على الروبوتات البشرية، على الرغم من أن الشركة تعد بمستوى معين من عدم اليقين بشأن الأجهزة.
يقول تشين: “نحن نحب الكثير من العمل الذي يحدث في مجال أجهزة الروبوت ذات الأغراض العامة”. “إن اقتران نقطة انعطاف الذكاء مع نقطة انعطاف الأجهزة هو المكان الذي سنشهد فيه المزيد من الانفجار في تطبيقات الروبوت. لكن الكثير من هذه الأمور لم يتم التوصل إليها بشكل كامل بعد، خاصة فيما يتعلق بالأجهزة. من الصعب جدًا تجاوز الفيديو المسرحي. كم عدد الأشخاص الذين تفاعلوا مع الإنسان شخصيًا؟ هذا يخبرك بدرجة النضج.”
ومع ذلك، لا يخجل Covariant من المقارنات البشرية عندما يتعلق الأمر بالدور الذي يلعبه RFM-1 في عمليات صنع القرار للروبوتات. وفقًا لمادتها الصحفية، توفر المنصة “للروبوتات القدرة الشبيهة بالإنسان على التفكير، مما يمثل المرة الأولى التي نجح فيها الذكاء الاصطناعي التوليدي في منح الروبوتات التجارية فهمًا أعمق للغة والعالم المادي”.
هذا هو أحد المجالات التي يتعين علينا أن نكون حذرين فيها فيما يتعلق بالادعاءات، سواء من حيث المقارنات بالمفاهيم المجردة – أو حتى الفلسفية – وفعاليتها الفعلية في العالم الحقيقي مع مرور الوقت. “القدرة على التفكير الشبيهة بالإنسان” هي مفهوم واسع النطاق يعني الكثير من الأشياء المختلفة لكثير من الأشخاص المختلفين. هنا تنطبق الفكرة على قدرة النظام على معالجة بيانات العالم الحقيقي وتحديد أفضل مسار للعمل لتنفيذ المهمة المطروحة.
يعد هذا خروجًا عن الأنظمة الروبوتية التقليدية التي تمت برمجتها للقيام بوظيفة واحدة بشكل متكرر إلى ما لا نهاية. لقد ازدهرت مثل هذه الروبوتات ذات الغرض الواحد في بيئات عالية التنظيم، بدءًا من خطوط تجميع السيارات. وطالما أن هناك تغييرات طفيفة في المهمة المطروحة، يمكن لذراع الروبوت القيام بعمله مرارًا وتكرارًا، دون عوائق، حتى يحين وقت إنهاء المهمة والحصول على ساعة الجيب الذهبية لسنوات من الخدمة المخلصة.
ومع ذلك، يمكن أن ينهار الشيء بسرعة، حتى مع أصغر الانحرافات. لنفترض أن الجسم لم يتم وضعه بشكل صحيح على الحزام الناقل، أو أنه كان هناك تعديل في الإضاءة يؤثر على الكاميرات الموجودة على متن الطائرة. يمكن أن يكون لهذه الأنواع من الاختلافات تأثير كبير على قدرة الروبوت على التنفيذ. تخيل الآن أنك تحاول جعل هذا الروبوت يعمل بجزء جديد، أو مادة جديدة، أو حتى يقوم بمهمة مختلفة تمامًا. وهذا أصعب.
هذه هي النقطة التي يتدخل فيها المبرمجون تقليديًا. يجب إعادة برمجة الروبوت. في أغلب الأحيان، يدخل الصورة شخص من خارج المصنع. وهذا استنزاف كبير للموارد والوقت. إذا كنت تريد تجنب ذلك، فيجب أن يحدث أحد أمرين. 1. يحتاج الأشخاص الذين يعملون على الأرض إلى تعلم التعليمات البرمجية أو 2. أنت بحاجة إلى طريقة جديدة وأكثر طبيعية للتفاعل مع الروبوت.
وفي حين أنه سيكون من الرائع القيام بالأمر الأول، يبدو من غير المرجح أن تكون الشركات على استعداد لاستثمار الأموال وانتظار الوقت اللازم. هذا الأخير هو بالضبط ما تحاول شركة Covariant القيام به مع RFM-1. لا يعد “ChatGPT للروبوتات” تشبيهًا مثاليًا، ولكنه اختصار معقول (خاصة في ضوء ارتباط المؤسسين بـ OpenAI).
من وجهة نظر العميل، يتم تقديم النظام كحقل نصي، يشبه إلى حد كبير التكرار الحالي للذكاء الاصطناعي التوليدي الذي يواجه المستهلك. أدخل أمرًا نصيًا مثل “التقاط التفاحة” عن طريق الكتابة أو الصوت، ويستخدم النظام بيانات التدريب الخاصة به (الشكل واللون والحجم وما إلى ذلك) لتحديد الكائن الموجود أمامه والذي يتطابق بشكل وثيق مع هذا الوصف.
يقوم RFM-1 بعد ذلك بإنشاء نتائج فيديو – في جوهرها عمليات محاكاة – لتحديد أفضل مسار للعمل باستخدام التدريب السابق. يشبه هذا الجزء الأخير الطريقة التي تعمل بها أدمغتنا على تحديد النتائج المحتملة للإجراء قبل تنفيذه.
أثناء العرض التجريبي المباشر، يتفاعل النظام مع مدخلات مثل “التقط الكائن الأحمر” وحتى أكثر تعقيدًا من الناحية الدلالية، “التقط ما تضعه على قدميك قبل أن ترتدي حذائك”، مما جعل الروبوت يلتقط الشيء الأحمر بشكل صحيح. تفاحة وزوج من الجوارب على التوالي.
يتم طرح الكثير من الأفكار الكبيرة عند مناقشة وعد النظام. على الأقل، تتمتع شركة Covariant بنسب مثيرة للإعجاب بين مؤسسيها. درس تشين الذكاء الاصطناعي في بيركلي على يد بيتر أبيل، أحد مؤسسيه وكبير العلماء. أصبح عبيل أيضًا أحد الموظفين الأوائل في OpenAI في عام 2016، بعد شهر من انضمام تشين إلى شركة ChatGPT. تأسست شركة Covariant في العام التالي.
يقول تشين إن الشركة تتوقع أن تعمل منصة RFM-1 الجديدة مع “أغلبية” الأجهزة التي تم نشر برنامج Covariant عليها بالفعل.
اكتشاف المزيد من مجلة كوكان
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.