يصل وكيل “نموذج العمل الكبير” المستند إلى الويب الخاص بـ Rabbit إلى r1 في الأول من أكتوبر
كان جهاز Rabbit r1 هو الأداة التي لا بد من اقتنائها في أوائل عام 2024، لكن الخجل تراجع عنها بسرعة كبيرة عندما فشلت وعود الشركة الموسعة في تحقيقها. يعترف الرئيس التنفيذي جيسي ليو بأنه “في اليوم الأول، وضعنا توقعاتنا مرتفعة للغاية”، لكنه قال أيضًا إن التحديث الذي سيأتي إلى الأجهزة الأسبوع المقبل سيؤدي أخيرًا إلى تعيين نموذج العمل الكبير المتبجح مجانًا على الويب.
في حين أن المتشككين قد يرون (بشكل مبرر) أن هذا قليل جدًا، أو متأخر جدًا، أو تغيير آخر في الأهداف، فإن طموح رابيت لبناء وكيل لا يعتمد على النظام الأساسي لتطبيقات الويب والهواتف المحمولة لا يزال يتمتع بقيمة أساسية – وإن كانت لا تزال نظرية إلى حد كبير.
وفي حديثه إلى TechCrunch، قال ليو إن الأشهر الستة الماضية كانت بمثابة زوبعة من عمليات الشحن وإصلاحات الأخطاء وتحسين أوقات الاستجابة وإضافة ميزات ثانوية. ولكن على الرغم من إجراء 16 تحديثًا عبر الهواء لـ r1، إلا أنه يظل يقتصر بشكل أساسي على التفاعل مع LLM أو الوصول إلى واحدة من سبع خدمات محددة، مثل Uber وSpotify.
وقال: “كانت هذه هي النسخة الأولى على الإطلاق من LAM، التي تم تدريبها على التسجيلات التي تم جمعها من العاملين في مجال البيانات، ولكنها ليست عامة – فهي تتصل فقط بتلك الخدمات”. سواء كان هذا ما يسمونه LAM أم لا، فهو أمر أكاديمي إلى حد كبير في هذه المرحلة؛ مهما كان النموذج، فإنه لم يوفر القدرات المفصلة لـ Rabbit في أول ظهور له.
وكيل عام على شبكة الإنترنت
لكن Rabbit جاهز لإصدار الإصدار العام الأول، والذي لا يقتصر على أي تطبيق أو واجهة، من LAM، والذي أظهره ليو لي.
هذا الإصدار عبارة عن وكيل قائم على الويب يوضح الخطوات اللازمة للقيام بأي مهمة عادية، مثل شراء تذاكر لحفل موسيقي، أو تسجيل موقع ويب، أو حتى لعب لعبة عبر الإنترنت. “هدفنا واضح للغاية: في نهاية شهر سبتمبر، سوف يقوم جهاز r1 الخاص بك فجأة بأشياء كثيرة. قال ليو: “يجب أن يدعم أي شيء يمكنك القيام به على أي موقع ويب”. (قدمت الشركة لاحقًا تاريخًا نهائيًا للتحديث هو 1 أكتوبر.)
عند إعطاء مهمة، يقوم أولاً بتقسيم هذه المهمة إلى خطوات، ثم يبدأ في تنفيذها من خلال تحليل ما يراه على الشاشة: الأزرار والحقول والصور، بغض النظر عن الموضع أو المظهر. ومن ثم يتفاعل مع العنصر المناسب بناءً على ما تعلمه بشكل عام حول كيفية عمل مواقع الويب.
طلبت منه (من خلال ليو، الذي كان يديره عن بعد) تسجيل موقع جديد لمهرجان سينمائي. من خلال اتخاذ إجراء كل بضع ثوانٍ، كان يبحث عن سجلات النطاق على Google، ويختار واحدًا (على ما أعتقد، واحدًا مدعومًا)، ويضع مهرجان الأفلام في مربع النطاق، ومن قائمة الخيارات الناتجة يتم اختيار “filmfestival2023.com” مقابل 14 دولارًا. من الناحية الفنية، لم أضع أي قيود عليه مثل “لعام 2025” أو “مهرجان الرعب” أو أي شيء آخر.
وبالمثل، عندما طلب منها Lyu البحث عن r1 وشرائه، سرعان ما وجد طريقه إلى موقع eBay، حيث كان العشرات معروضًا للبيع. ربما تكون نتيجة جيدة للمستخدم ولكن ليس لمؤسس الشركة التي تقدم للصحافة! لقد ضحك عليه وقام بالمطالبة مرة أخرى مع إضافة أنه يجب الشراء فقط من الموقع الرسمي. نجح الوكيل.
بعد ذلك، جعله يلعب لعبة الكلمات اليومية على موقع Dictionary.com. لقد استغرق الأمر بعضًا من الهندسة السريعة (اكتشف النموذج أنه يمكن أن ينتهي بسرعة عن طريق النقر على “نهاية اللعبة”) ولكنه نجح في ذلك.
ولكن ما هو المتصفح الذي يستخدمه؟ قال ليو إنه إصدار جديد ونظيف في السحابة، لكنهم يعملون على إصدارات محلية، مثل امتداد Chrome، مما يعني أنه يمكنك استخدام الجلسات الحالية ولن تضطر إلى تسجيل الدخول إلى خدماتك.
ولتحقيق هذه الغاية، نظرًا لأن المستخدمين يشعرون بالقلق (وبحق) من منح أي شركة حق الوصول الكامل إلى بيانات الاعتماد الخاصة بهم، فإن الوكيل غير مجهز بهذه البيانات. اقترح ليو أنه يمكن استدعاء نموذج لغة صغير مسور ببيانات الاعتماد الخاصة بك بشكل خاص في المستقبل لإجراء عمليات تسجيل الدخول. ويبدو أن السؤال مفتوح حول كيفية عمل ذلك، وهو أمر متوقع إلى حد ما نظرا لحداثة الفضاء.
لا تزال تتعلم
أظهر لي العرض التوضيحي بعض الأشياء. أولاً، إذا أعطينا الشركة ومطوريها فائدة الشك في أن هذه ليست مجرد خدعة معقدة (كما يعتقد البعض)، فيبدو أنها وكيل ويب عامل للأغراض العامة. وسيكون هذا، إن لم يكن الأول في حد ذاته، الأول بالتأكيد الذي يمكن للمستهلكين الوصول إليه بسهولة.
وقال ليو: “هناك شركات تقوم بقطاعات رأسية، لبرنامج Excel أو المستندات القانونية، لكنني أعتقد أن هذه واحدة من أوائل الوكلاء العامين للمستهلكين”. “الفكرة هي أنه يمكنك قول أي شيء يمكن تحقيقه من خلال موقع على شبكة الإنترنت. سيكون لدينا الوكيل العام لمواقع الويب أولاً، ثم للتطبيقات.
ثانياً، أظهر أن الهندسة السريعة لا تزال مطلوبة بشدة. إن كيفية صياغة الطلب يمكن أن تشكل بسهولة الفرق بين النجاح والفشل، وربما لا يتحمل المستهلكون العاديون هذا الأمر.
حذر ليو من أن هذه “نسخة ساحة اللعب”، وليست نهائية بأي حال من الأحوال، وأنه على الرغم من كونها وكيل ويب عام يعمل بكامل طاقته، إلا أنه لا يزال من الممكن تحسينها بعدة طرق. على سبيل المثال، قال: “النموذج ذكي بما يكفي للقيام بالتخطيط، لكنه ليس ذكيًا بما يكفي لتخطي الخطوات”. لن “يتعلم” أن المستخدم يفضل عدم شراء أجهزته الإلكترونية على موقع eBay، أو أنه يجب عليه التمرير لأسفل بعد البحث لتجنب جدار النتائج المدعومة.
لن يتم جمع بيانات المستخدم لتحسين النموذج – حتى الآن. وأرجع ليو ذلك إلى حقيقة أنه لا توجد طريقة تقييم لنظام مثل هذا، لذلك من الصعب القول كميًا ما إذا كان قد تم إجراء تحسينات أم لا. ومع ذلك، يأتي “وضع التدريس” أيضًا، حتى تتمكن من إظهار كيفية القيام بنوع معين من المهام.
ومن المثير للاهتمام أن الشركة تعمل أيضًا على وكيل سطح مكتب يمكنه التفاعل مع تطبيقات مثل معالجات النصوص ومشغلات الموسيقى والمتصفحات بالطبع. لا يزال هذا في المراحل الأولى، لكنه يعمل. “لا تحتاج حتى إلى إدخال وجهة، فهي تحاول فقط استخدام الكمبيوتر. وطالما أن هناك واجهة، فيمكن التحكم فيها.
ثالثًا، لا يوجد حتى الآن “تطبيق قاتل”، أو على الأقل لا يوجد تطبيق واضح. الوكيل مثير للإعجاب، لكنني شخصيًا لن أستخدمه كثيرًا، لسوء الحظ أجلس أمام المتصفح لمدة ثماني ساعات يوميًا على أي حال. من المؤكد تقريبًا أن هناك بعض التطبيقات الرائعة، ولكن لم يتبادر إلى ذهني أي منها يجعل فائدة الإنسان الآلي المعتمد على المتصفح واضحة مثل فائدة المكنسة الآلية على سبيل المثال.
لماذا ليس التطبيق، مرة أخرى؟
لقد أثرت الاعتراض الشائع على نموذج عمل شركة رابيت بأكمله، وهو في الأساس أن “هذا يمكن أن يكون تطبيقًا”.
من الواضح أن ليو سمع هذا النقد عدة مرات، وكان واثقًا من إجابته.
قال: “إذا قمت بالحسابات، فلن يكون الأمر منطقيًا”. “نعم، إنه أمر ممكن تحقيقه من الناحية الفنية، ولكنك ستثير غضب أبل وجوجل منذ اليوم الأول. لن يدعوا هذا أبدًا أفضل من Siri أو Gemini. تمامًا كما لا توجد طريقة تمكن ذكاء Apple من التحكم في أشياء Google بشكل أفضل، أو العكس. ويأخذون 30% من الإيرادات! إذا كنا قد قمنا في البداية ببناء تطبيق، فلن نحصل على هذا الزخم أبدًا.
الفكرة الأساسية التي يقدمها Rabbit هي أنه يمكن أن يكون هناك ذكاء اصطناعي أو جهاز تابع لجهة خارجية يمكنه الوصول إلى جميع خدماتك الأخرى وتشغيلها، ومن خارجها، مثلك. “نظام وكيل عام متعدد المنصات”، كما أسماه ليو. “سوف نتحكم في كل واجهة مستخدم، ويعد موقع الويب بداية جيدة. ثم سننتقل إلى Windows، وإلى MacOS، وإلى الهواتف.
بالحديث عن ذلك: “لم نقل أبدًا أننا لن نبني هاتفًا في المستقبل.” أليس هذا يتناقض مع أطروحتهم الأصلية المتمثلة في جهاز أصغر وأبسط؟ ربما، وربما لا.
وفي هذه الأثناء، يعملون على البدء في الوفاء بالوعود التي قطعوها في وقت مبكر من هذا العام. يجب أن يكون النموذج الجديد متاحًا لأي مالك لجهاز r1 في وقت ما من هذا الأسبوع عند صدور التحديث عبر الهواء. ستصل بعد ذلك أيضًا تعليمات حول كيفية استدعائها. حذر ليو المستخدمين المتوقعين من خلال بساطته المميزة.
“نحن نحدد التوقعات بشكل صحيح. وقال: “إنها ليست مثالية”. “إنه أفضل ما حققه الجنس البشري حتى الآن.”
اكتشاف المزيد من مجلة كوكان
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.