يمكن لنموذج توليد الفيديو Sora الخاص بشركة OpenAI أن يعرض ألعاب الفيديو أيضًا
OpenAI الجديد – والأول! — نموذج إنتاج الفيديو، Sora، يمكنه تحقيق بعض الأعمال السينمائية الرائعة حقًا. لكن النموذج متعادل أكثر قادرة على أن تكون OpenAI في البداية، على الأقل إذا حكمنا من خلال ورقة فنية نشرت هذا المساء.
إن الورقة التي تحمل عنوان “نماذج توليد الفيديو كمحاكيات عالمية”، والتي شارك في تأليفها مجموعة من الباحثين في OpenAI، تزيل الستار عن الجوانب الرئيسية لهندسة سورا – على سبيل المثال، تكشف أن سورا يمكنه إنشاء مقاطع فيديو ذات دقة ونسبة عرض إلى ارتفاع عشوائية ( حتى 1080 بكسل). وفقًا للورقة البحثية، فإن Sora قادر على تنفيذ مجموعة من مهام تحرير الصور والفيديو، بدءًا من إنشاء مقاطع فيديو متكررة إلى تمديد مقاطع الفيديو للأمام أو للخلف في الوقت المناسب وحتى تغيير الخلفية في مقطع فيديو موجود.
لكن الأمر الأكثر إثارة للاهتمام بالنسبة لهذا الكاتب هو قدرة سورا على “محاكاة العوالم الرقمية”، على حد تعبير المؤلفين المشاركين في OpenAI. في إحدى التجارب، أطلق OpenAI سراح Sora على لعبة Minecraft وجعله يعرض العالم – وديناميكياته، بما في ذلك الفيزياء – بينما يتحكم في اللاعب في نفس الوقت.
إذًا كيف يستطيع سورا فعل هذا؟ حسنًا، كما لاحظ جيم فان، أحد كبار الباحثين في Nvidia (عبر كوارتز)، فإن Sora هو “محرك فيزيائي يعتمد على البيانات” أكثر من كونه مبدعًا أيضًا. لا يقتصر الأمر على إنشاء صورة أو مقطع فيديو واحد فحسب، بل تحديد فيزياء كل كائن في البيئة – وتقديم صورة أو مقطع فيديو (أو عالم تفاعلي ثلاثي الأبعاد، حسب الحالة) بناءً على هذه الحسابات.
كتب المؤلفون المشاركون: “تشير هذه القدرات إلى أن التوسع المستمر في نماذج الفيديو يعد طريقًا واعدًا نحو تطوير أجهزة محاكاة عالية القدرة للعالم المادي والرقمي، والأشياء والحيوانات والأشخاص الذين يعيشون بداخلها”.
الآن، تنطبق قيود Sora المعتادة في مجال ألعاب الفيديو. لا يستطيع النموذج أن يقارب بدقة فيزياء التفاعلات الأساسية مثل تحطم الزجاج. وحتى مع التفاعلات ذلك يستطيع النموذج، غالبًا ما يكون سورا غير متسق – على سبيل المثال تصوير شخص يأكل برجر ولكنه يفشل في ترك علامات العض.
ومع ذلك، إذا كنت أقرأ الورقة بشكل صحيح، فيبدو أن Sora يمكن أن يمهد الطريق لألعاب أكثر واقعية – وربما حتى واقعية – تم إنشاؤها من الناحية الإجرائية. وهذا أمر مثير ومرعب في نفس الوقت (فكر في آثار التزييف العميق، على سبيل المثال) – وهذا على الأرجح هو السبب وراء اختيار OpenAI لبوابة Sora خلف جداً برنامج وصول محدود في الوقت الراهن.
ونأمل أن نتعلم المزيد عاجلاً وليس آجلاً.
اكتشاف المزيد من مجلة كوكان
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.