تزدهر السحابات البديلة حيث تسعى الشركات إلى الوصول إلى وحدات معالجة الرسومات بتكلفة أقل
لم تكن الشهية للسحب البديلة أكبر من أي وقت مضى.
مثال على ذلك: جمعت شركة CoreWeave، مزود البنية التحتية لوحدة معالجة الرسومات، والتي بدأت حياتها كعملية تعدين للعملات المشفرة، هذا الأسبوع 1.1 مليار دولار من التمويل الجديد من المستثمرين بما في ذلك Coatue وFidelity وAltimeter Capital. ترفع الجولة تقييمها إلى 19 مليار دولار أمريكي بعد خصم النقود، وقد ارتفع إجماليها إلى 5 مليارات دولار أمريكي من الديون والأسهم – وهو رقم رائع بالنسبة لشركة عمرها أقل من عشر سنوات.
انها ليست مجرد CoreWeave.
حصلت Lambda Labs، التي تقدم أيضًا مجموعة من مثيلات GPU المستضافة على السحابة، في أوائل أبريل على “وسيلة تمويل للأغراض الخاصة” تصل إلى 500 مليون دولار، بعد أشهر من إغلاق جولة السلسلة C بقيمة 320 مليون دولار. أعلنت منظمة فولتاج بارك غير الربحية، المدعومة من الملياردير جيد ماكالب، في أكتوبر الماضي أنها تستثمر 500 مليون دولار في مراكز البيانات المدعومة بوحدة معالجة الرسومات. وحصلت Together AI، وهي مضيفة GPU السحابية التي تجري أيضًا أبحاثًا توليدية للذكاء الاصطناعي، في مارس على 106 مليون دولار في جولة بقيادة Salesforce.
فلماذا كل هذا الحماس والأموال المتدفقة على الفضاء السحابي البديل؟
الجواب، كما قد تتوقع، هو الذكاء الاصطناعي التوليدي.
مع استمرار فترات ازدهار الذكاء الاصطناعي التوليدي، يتزايد أيضًا الطلب على الأجهزة لتشغيل وتدريب نماذج الذكاء الاصطناعي التوليدي على نطاق واسع. تعد وحدات معالجة الرسومات، من الناحية المعمارية، الخيار المنطقي للتدريب والضبط الدقيق وتشغيل النماذج لأنها تحتوي على آلاف النوى التي يمكنها العمل بالتوازي لتنفيذ معادلات الجبر الخطية التي تشكل النماذج التوليدية.
لكن تثبيت وحدات معالجة الرسومات أمر مكلف. لذلك يلجأ معظم المطورين والمؤسسات إلى السحابة بدلاً من ذلك.
لا تقدم الشركات القائمة في مجال الحوسبة السحابية – Amazon Web Services (AWS) وGoogle Cloud وMicrosoft Azure – أي نقص في وحدات معالجة الرسومات ومثيلات الأجهزة المتخصصة المُحسّنة لأحمال عمل الذكاء الاصطناعي التوليدية. ولكن بالنسبة لبعض النماذج والمشاريع على الأقل، يمكن أن تصبح السحابات البديلة أرخص في نهاية المطاف – وتوفر توافرًا أفضل.
في CoreWeave، تبلغ تكلفة استئجار جهاز Nvidia A100 40GB – أحد الخيارات الشائعة للتدريب النموذجي والاستدلال – 2.39 دولارًا في الساعة، وهو ما يصل إلى 1200 دولار شهريًا. في Azure، تبلغ تكلفة نفس وحدة معالجة الرسوميات 3.40 دولارًا في الساعة، أو 2482 دولارًا في الشهر؛ على Google Cloud، تبلغ التكلفة 3.67 دولارًا أمريكيًا للساعة، أو 2682 دولارًا أمريكيًا شهريًا.
نظرًا لأن أحمال عمل الذكاء الاصطناعي التوليدية يتم تنفيذها عادةً على مجموعات من وحدات معالجة الرسومات، فإن دلتا التكلفة تنمو بسرعة.
قال Sid Nag، نائب رئيس الخدمات والتقنيات السحابية في Gartner لـ TechCrunch: “تشارك شركات مثل CoreWeave في سوق نسميه موفري الخدمات السحابية المتخصصة بوحدة معالجة الرسومات كخدمة”. “نظرًا لارتفاع الطلب على وحدات معالجة الرسومات، فإنهم يقدمون بديلاً لوحدات المعالجة الرسومية الفائقة، حيث أخذوا وحدات معالجة الرسومات من Nvidia وقدموا طريقًا آخر للتسويق والوصول إلى وحدات معالجة الرسومات هذه.”
ويشير ناج إلى أنه حتى بعض شركات التكنولوجيا الكبرى بدأت في الاعتماد على موفري الخدمات السحابية البديلة في ظل مواجهتهم تحديات القدرة الحاسوبية.
في يونيو الماضي، ذكرت CNBC أن مايكروسوفت وقعت صفقة بمليارات الدولارات مع CoreWeave لضمان أن OpenAI، الشركة المصنعة لـ ChatGPT وشريك مايكروسوفت الوثيق، سيكون لديها القدرة الحاسوبية الكافية لتدريب نماذج الذكاء الاصطناعي التوليدية الخاصة بها. وترى شركة Nvidia، الشركة المصنعة للجزء الأكبر من رقائق CoreWeave، أن هذا اتجاه مرغوب فيه، ربما لأسباب تتعلق بالرافعة المالية؛ يقال إنها منحت بعض موفري الخدمات السحابية البديلة وصولاً تفضيليًا إلى وحدات معالجة الرسومات الخاصة بهم.
يرى لي سوستار، المحلل الرئيسي في شركة Forrester، أن البائعين السحابيين مثل CoreWeave ينجحون جزئيًا لأنهم لا يملكون “أمتعة” البنية التحتية التي يتعين على مقدمي الخدمات الحاليين التعامل معها.
“نظرًا لهيمنة تقنية التوسعة الفائقة على سوق السحابة العامة بشكل عام، والتي تتطلب استثمارات ضخمة في البنية التحتية ومجموعة من الخدمات التي تحقق إيرادات ضئيلة أو معدومة، فإن المنافسين مثل CoreWeave لديهم فرصة للنجاح من خلال التركيز على خدمات الذكاء الاصطناعي المتميزة دون عبء مستوى التوسعة الفائقة وقال الاستثمارات بشكل عام.
ولكن هل هذا النمو مستدام؟
سوستار لديه شكوكه. وهو يعتقد أن توسع موفري الخدمات السحابية البديلة سيكون مشروطًا بما إذا كان بإمكانهم الاستمرار في جلب وحدات معالجة الرسومات عبر الإنترنت بكميات كبيرة، وتقديمها بأسعار منخفضة تنافسية.
قد يصبح التنافس على الأسعار أمرًا صعبًا في المستقبل، حيث تعمل الشركات القائمة مثل Google وMicrosoft وAWS على زيادة الاستثمارات في الأجهزة المخصصة لتشغيل النماذج وتدريبها. تقدم Google مواد TPU الخاصة بها؛ وكشفت مايكروسوفت مؤخرًا عن شريحتين مخصصتين، Azure Maia وAzure Cobalt؛ وAWS لديها Trainium وInferentia وGraviton.
وقال سوستار: “سوف يستفيد Hypercalers من السيليكون المخصص لديهم للتخفيف من اعتمادهم على Nvidia، بينما ستتطلع Nvidia إلى CoreWeave وغيرها من سحب الذكاء الاصطناعي التي تركز على GPU”.
ثم هناك حقيقة أنه على الرغم من أن العديد من أعباء عمل الذكاء الاصطناعي التوليدي تعمل بشكل أفضل على وحدات معالجة الرسومات، إلا أن جميع أعباء العمل لا تحتاج إليها – خاصة إذا لم تكن حساسة للوقت. يمكن لوحدات المعالجة المركزية (CPUs) تشغيل الحسابات الضرورية، ولكنها عادةً ما تكون أبطأ من وحدات معالجة الرسومات (GPU) والأجهزة المخصصة.
ومن الناحية الوجودية، هناك تهديد بأن تنفجر فقاعة الذكاء الاصطناعي التوليدي، الأمر الذي من شأنه أن يترك مقدمي الخدمات مع أكوام من وحدات معالجة الرسومات وعدم وجود عدد كافٍ من العملاء الذين يطالبون بها. لكن المستقبل يبدو ورديًا على المدى القصير، كما يقول سوستار وناج، وكلاهما يتوقع تدفقًا مستمرًا من السحب الناشئة.
“سوف تقدم الشركات الناشئة السحابية الموجهة نحو GPU [incumbents] وقال سوستار: “هناك الكثير من المنافسة، خاصة بين العملاء الذين لديهم بالفعل سحابات متعددة ويمكنهم التعامل مع تعقيد الإدارة والأمن والمخاطر والامتثال عبر السحابات المتعددة”. “يشعر هؤلاء العملاء السحابيون بالراحة في تجربة سحابة الذكاء الاصطناعي الجديدة إذا كانت تتمتع بقيادة موثوقة ودعم مالي قوي ووحدات معالجة رسوميات بدون أوقات انتظار.
اكتشاف المزيد من مجلة كوكان
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.