×

يستطيع Sora، أحدث طراز من OpenAI، إنشاء مقاطع فيديو، وهي تبدو جيدة

يستطيع Sora، أحدث طراز من OpenAI، إنشاء مقاطع فيديو، وهي تبدو جيدة

[ad_1]

شركة OpenAI، التي تسير على خطى الشركات الناشئة مثل Runway وعمالقة التكنولوجيا مثل Google وMeta، تدخل في مجال إنتاج الفيديو.

كشفت OpenAI اليوم عن Sora، وهو نموذج ذكاء اصطناعي توليدي يقوم بإنشاء فيديو من النص. من خلال تقديم وصف مختصر أو تفصيلي أو صورة ثابتة، يمكن لـ Sora إنشاء مشاهد تشبه الأفلام بدقة 1080 بكسل مع شخصيات متعددة وأنواع مختلفة من الحركة وتفاصيل الخلفية، كما تدعي OpenAI.

يستطيع Sora أيضًا “توسيع” مقاطع الفيديو الموجودة، حيث يبذل قصارى جهده لملء التفاصيل المفقودة.

“يتمتع Sora بفهم عميق للغة، مما يمكنه من تفسير المطالبات بدقة وإنشاء أحرف مقنعة تعبر عن المشاعر النابضة بالحياة،” كتب OpenAI في منشور بالمدونة. “لا يفهم النموذج ما طلبه المستخدم في الموجه فحسب، بل يفهم أيضًا كيفية وجود هذه الأشياء في العالم المادي.

الآن، هناك الكثير من الكلام المنمق في الصفحة التجريبية لـ OpenAI الخاصة بـ Sora – والبيان أعلاه مثال على ذلك. لكن العينات المنتقاة من النموذج يفعل تبدو مثيرة للإعجاب إلى حد ما، على الأقل بالمقارنة مع تقنيات تحويل النص إلى الفيديو الأخرى التي رأيناها.

بالنسبة للمبتدئين، يمكن لـ Sora إنشاء مقاطع فيديو بمجموعة من الأنماط (على سبيل المثال، الصور الواقعية، والرسوم المتحركة، والأسود والأبيض) تصل مدتها إلى دقيقة واحدة – أطول بكثير من معظم نماذج تحويل النص إلى فيديو. وتحافظ مقاطع الفيديو هذه على تماسك معقول، بمعنى أنها لا تستسلم دائمًا لما أحب أن أسميه “غرابة الذكاء الاصطناعي”، مثل الأجسام التي تتحرك في اتجاهات مستحيلة فيزيائيًا.

اطلع على هذه الجولة لمعرض فني، تم إنشاؤها كلها بواسطة Sora (تجاهل التحبب – الضغط من أداة تحويل الفيديو إلى GIF):

أوبن آي سورا

اعتمادات الصورة: OpenAI

أو هذه الرسوم المتحركة لزهرة تتفتح:

أوبن آي سورا

اعتمادات الصورة: OpenAI

سأقول إن بعض مقاطع فيديو سورا التي تتناول موضوعًا بشريًا – روبوت يقف في مواجهة منظر المدينة، على سبيل المثال، أو شخص يسير في طريق ثلجي – تتمتع بجودة ألعاب فيديو، ربما لأنه لا يوجد الكثير مما يحدث في الخلفية. تمكنت غرابة الذكاء الاصطناعي من التسلل إلى العديد من المقاطع إلى جانب ذلك، مثل قيادة السيارات في اتجاه واحد، ثم الرجوع للخلف فجأة أو ذوبان الأذرع في غطاء اللحاف.

أوبن آي سورا

اعتمادات الصورة: OpenAI

تقر شركة OpenAI، على الرغم من كل صيغها المتفوقة، بأن النموذج ليس مثاليًا. يكتب:

“[Sora] قد يجد صعوبة في محاكاة فيزياء مشهد معقد بدقة، وقد لا يفهم حالات محددة من السبب والنتيجة. على سبيل المثال، قد يأخذ شخص ما قضمة من ملف تعريف الارتباط، ولكن بعد ذلك، قد لا يكون هناك علامة قضمة على ملف تعريف الارتباط. قد يخلط النموذج أيضًا بين التفاصيل المكانية للموجه، على سبيل المثال، الخلط بين اليسار واليمين، وقد يواجه صعوبة في الوصف الدقيق للأحداث التي تحدث مع مرور الوقت، مثل اتباع مسار معين للكاميرا.

قامت OpenAI بوضع Sora على أنه معاينة بحثية إلى حد كبير، ولم تكشف سوى القليل عن البيانات المستخدمة لتدريب النموذج (أقل من 10000 ساعة من الفيديو “عالي الجودة”) والامتناع عن جعل Sora متاحًا بشكل عام. الأساس المنطقي لها هو احتمال إساءة الاستخدام؛ يشير OpenAI بشكل صحيح إلى أن الجهات الفاعلة السيئة يمكن أن تسيء استخدام نموذج مثل Sora بطرق لا تعد ولا تحصى.

تقول OpenAI إنها تعمل مع الخبراء لفحص نموذج الثغرات وبناء الأدوات لاكتشاف ما إذا كان Sora قد تم إنشاء مقطع فيديو أم لا. وتقول الشركة أيضًا إنه إذا اختارت بناء النموذج في منتج يواجه الجمهور، فسوف تضمن تضمين البيانات التعريفية للمصدر في المخرجات التي تم إنشاؤها.

“سنقوم بإشراك صناع القرار والمعلمين والفنانين في جميع أنحاء العالم لفهم مخاوفهم وتحديد حالات الاستخدام الإيجابي لهذه التكنولوجيا الجديدة،” يكتب OpenAI. “على الرغم من الأبحاث والاختبارات المكثفة، لا يمكننا التنبؤ بجميع الطرق المفيدة التي سيستخدم بها الأشخاص التكنولوجيا لدينا، ولا جميع الطرق التي سيسيء بها الناس استخدامها. ولهذا السبب نعتقد أن التعلم من الاستخدام في العالم الحقيقي يعد عنصرًا حاسمًا في إنشاء وإطلاق أنظمة ذكاء اصطناعي آمنة بشكل متزايد بمرور الوقت.

[ad_2]

إرسال التعليق

You May Have Missed