يستخدم برنامج Runware أجهزة مخصصة وتنسيقًا متقدمًا للاستدلال السريع للذكاء الاصطناعي
في بعض الأحيان، يكون العرض التوضيحي هو كل ما تحتاجه لفهم منتج ما. وهذا هو الحال مع Runware. إذا توجهت إلى موقع Runware الإلكتروني، فأدخل مطالبة واضغط على Enter لإنشاء صورة، ستفاجأ بمدى سرعة إنشاء Runware للصورة لك – يستغرق الأمر أقل من ثانية.
Runware هو الوافد الجديد في مجال استدلال الذكاء الاصطناعي، أو الذكاء الاصطناعي التوليدي، في مجال بدء التشغيل. تقوم الشركة ببناء خوادمها الخاصة وتحسين طبقة البرامج على تلك الخوادم لإزالة الاختناقات وتحسين سرعات الاستدلال لنماذج توليد الصور. حصلت الشركة الناشئة بالفعل على تمويل بقيمة 3 ملايين دولار من شركة Speedrun التابعة لشركة Andreessen Horowitz، وشركة LakeStar’s Halo II وLunar Ventures.
الشركة لا تريد إعادة اختراع العجلة. إنها تريد فقط أن تجعلها تدور بشكل أسرع. خلف الكواليس، تقوم شركة Runware بتصنيع خوادمها الخاصة بأكبر عدد ممكن من وحدات معالجة الرسومات على نفس اللوحة الأم. لديها نظام تبريد خاص بها وتدير مراكز البيانات الخاصة بها.
عندما يتعلق الأمر بتشغيل نماذج الذكاء الاصطناعي على خوادمها، قامت شركة Runware بتحسين طبقة التنسيق باستخدام تحسينات BIOS ونظام التشغيل لتحسين أوقات البدء البارد. لقد طورت خوارزمياتها الخاصة التي تخصص أعباء عمل التداخل.
العرض مثير للإعجاب في حد ذاته. والآن تريد الشركة استخدام كل هذا العمل في البحث والتطوير وتحويله إلى عمل تجاري.
على عكس العديد من شركات استضافة وحدات معالجة الرسومات، لن تقوم شركة Runware بتأجير وحدات معالجة الرسومات الخاصة بها بناءً على وقت وحدة معالجة الرسومات. وبدلاً من ذلك، تعتقد أنه ينبغي تشجيع الشركات على تسريع أعباء العمل. ولهذا السبب تقدم Runware واجهة برمجة التطبيقات (API) لإنشاء الصور مع هيكل رسوم التكلفة التقليدية لكل استدعاء لواجهة برمجة التطبيقات (API). إنه يعتمد على نماذج الذكاء الاصطناعي الشهيرة من Flux وStable Diffusion.
قال المؤسس المشارك والرئيس التنفيذي فلافيو رادوليسكو لـ TechCrunch: “إذا نظرت إلى Together AI وReplicate وHugging Face – كلهم - فإنهم يبيعون الحوسبة بناءً على وقت GPU”. “إذا قارنت مقدار الوقت الذي يستغرقه صنع الصورة معهم. وبعد ذلك تقارن الأسعار، سترى أننا أرخص بكثير وأسرع بكثير.
وأضاف: “سيكون من المستحيل عليهم مجاراة هذا الأداء”. “خاصة في مزود السحابة، يجب عليك العمل في بيئة افتراضية، مما يضيف تأخيرات إضافية.”
نظرًا لأن Runware تتطلع إلى مسار الاستدلال بالكامل، وتعمل على تحسين الأجهزة والبرامج، تأمل الشركة أن تتمكن من استخدام وحدات معالجة الرسومات من بائعين متعددين في المستقبل القريب. لقد كان هذا مسعى مهمًا للعديد من الشركات الناشئة نظرًا لأن Nvidia هي الشركة الرائدة بوضوح في مجال GPU، مما يعني أن وحدات معالجة الرسوميات Nvidia تميل إلى أن تكون باهظة الثمن.
“في الوقت الحالي، نستخدم وحدات معالجة الرسوميات Nvidia فقط. وقال رادوليسكو: “لكن هذا يجب أن يكون تجريدًا لطبقة البرمجيات”. “يمكننا تبديل نموذج من ذاكرة وحدة معالجة الرسومات إلى الداخل والخارج بسرعة كبيرة جدًا، مما يسمح لنا بوضع عملاء متعددين على نفس وحدات معالجة الرسومات.
“لذلك نحن لسنا مثل منافسينا. إنهم يقومون فقط بتحميل نموذج في وحدة معالجة الرسومات ثم تقوم وحدة معالجة الرسومات بنوع محدد جدًا من المهام. في حالتنا، قمنا بتطوير هذا الحل البرمجي، والذي يسمح لنا بتبديل النموذج في ذاكرة وحدة معالجة الرسومات أثناء قيامنا بالاستدلال.
إذا كان بإمكان AMD وبائعي وحدات معالجة الرسومات الآخرين إنشاء طبقات توافق تعمل مع أحمال عمل الذكاء الاصطناعي النموذجية، فإن Runware في وضع جيد لبناء سحابة هجينة تعتمد على وحدات معالجة الرسومات من بائعين متعددين. وهذا سيساعد بالتأكيد إذا أرادت أن تظل أرخص من المنافسين في استدلال الذكاء الاصطناعي.
اكتشاف المزيد من مجلة كوكان
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.