هل تتفوق صفقات OpenAI مع الناشرين على المنافسة؟
ربما لا تزال معركة OpenAI القانونية مع صحيفة نيويورك تايمز حول البيانات اللازمة لتدريب نماذج الذكاء الاصطناعي الخاصة بها في طور التخمير. لكن شركة OpenAI تمضي قدمًا في إبرام صفقات مع ناشرين آخرين، بما في ذلك بعض أكبر ناشري الأخبار في فرنسا وإسبانيا.
أعلنت شركة OpenAI يوم الأربعاء أنها وقعت عقودًا مع Le Monde وPrisa Media لجلب المحتوى الإخباري الفرنسي والإسباني إلى برنامج الدردشة ChatGPT الخاص بـ OpenAI. في منشور بالمدونة، قالت OpenAI أن الشراكة ستضع تغطية الأحداث الحالية للمنظمات – من العلامات التجارية بما في ذلك El País وCinco Días وAs وEl Huffpost – أمام مستخدمي ChatGPT حيث يكون ذلك منطقيًا، بالإضافة إلى المساهمة في OpenAI على الإطلاق -توسيع حجم بيانات التدريب.
كتب OpenAI:
خلال الأشهر المقبلة، سيتمكن مستخدمو ChatGPT من التفاعل مع المحتوى الإخباري ذي الصلة من هؤلاء الناشرين من خلال ملخصات مختارة مع الإسناد والروابط المحسنة للمقالات الأصلية، مما يمنح المستخدمين القدرة على الوصول إلى معلومات إضافية أو مقالات ذات صلة من مواقع الأخبار الخاصة بهم … نعمل باستمرار على إجراء تحسينات على ChatGPT وندعم الدور الأساسي لصناعة الأخبار في تقديم معلومات موثوقة في الوقت الفعلي للمستخدمين.
لذلك، كشفت OpenAI عن صفقات ترخيص مع عدد قليل من موفري المحتوى في هذه المرحلة. شعرت الآن بأنها فرصة جيدة لتقييم الأمور:
- مكتبة وسائط المخزون Shutterstock (للصور ومقاطع الفيديو وبيانات التدريب على الموسيقى)
- وكالة أسوشيتد برس
- أكسل سبرينغر (مالك موقعي Politico وBusiness Insider وغيرهما)
- لوموند
- بريسا ميديا
ما المبلغ الذي يدفعه OpenAI لكل منهما؟ حسنًا، هذا لا يقول – على الأقل ليس علنًا. لكن يمكننا التقدير.
ذكرت المعلومات في يناير أن OpenAI كانت تعرض على الناشرين ما بين مليون إلى 5 ملايين دولار سنويًا للوصول إلى الأرشيف لتدريب نماذج GenAI الخاصة بها. هذا لا يخبرنا كثيرًا عن شراكة Shutterstock. ولكن على جبهة ترخيص المقالات – بافتراض أن تقارير The Information دقيقة وأن هذه الأرقام لم تتغير منذ ذلك الحين – فإن OpenAI تنفق ما بين 4 ملايين دولار و20 مليون دولار سنويًا للأخبار.
قد يكون هذا مبلغًا زهيدًا بالنسبة لـ OpenAI، التي تبلغ ثروتها أكثر من 11 مليار دولار والتي تجاوزت إيراداتها السنوية مؤخرًا 2 مليار دولار (وفقًا لصحيفة فايننشال تايمز). ولكن كما قال Hunter Walk، الشريك في Homebrew والمؤسس المشارك لشركة Screendoor، مؤخرًا، إنها كبيرة بما يكفي للتغلب على منافسي الذكاء الاصطناعي الذين يسعون أيضًا إلى اتفاقيات الترخيص.
كتب ووك في مدونته:
[I]إذا كان التجريب مقيدًا بصفقات ترخيص تبلغ قيمتها تسعة أرقام، فإننا نلحق الضرر بالابتكار… إن عمليات التحقق التي يتم قطعها عن “مالكي” بيانات التدريب تخلق حاجزًا كبيرًا أمام دخول المنافسين. وإذا تمكنت شركات جوجل، وOpenAI، وغيرها من شركات التكنولوجيا الكبرى من تحديد تكلفة عالية بالقدر الكافي، فإنها تمنع ضمناً المنافسة في المستقبل.
الآن، ما إذا كان هناك عائق أمام الدخول اليوم هو أمر قابل للنقاش. لقد اختار العديد من بائعي الذكاء الاصطناعي – إن لم يكن معظمهم – المخاطرة بإثارة غضب أصحاب حقوق الملكية الفكرية، واختاروا عدم ترخيص البيانات التي يقومون بتدريب نماذج الذكاء الاصطناعي عليها. هناك أدلة على أن منصة إنتاج الأعمال الفنية Midjourney، على سبيل المثال، تتدرب على لقطات أفلام ديزني الثابتة – وليس لدى Midjourney أي صفقة مع Disney.
والسؤال الأصعب الذي يجب التصدي له هو: هل ينبغي أن يكون الترخيص ببساطة هو تكلفة ممارسة الأعمال التجارية والتجريب في مجال الذكاء الاصطناعي؟
سوف يجادل المشي لا. وهو يدعو إلى “الملاذ الآمن” الذي تفرضه الجهات التنظيمية والذي يحمي أي بائع للذكاء الاصطناعي – وكذلك الشركات الناشئة الصغيرة والباحثين – من المسؤولية القانونية طالما أنهم يلتزمون ببعض الشفافية والمعايير الأخلاقية.
ومن المثير للاهتمام أن المملكة المتحدة حاولت مؤخرًا تدوين شيء ما على هذا المنوال، مع استثناء استخدام استخراج النصوص والبيانات للتدريب على الذكاء الاصطناعي من اعتبارات حقوق الطبع والنشر طالما أنه لأغراض البحث. لكن تلك الجهود انتهت بالفشل.
أنا لست متأكدًا من أنني سأذهب إلى أبعد من ذلك في اقتراح ووك بشأن “الملاذ الآمن” مع الأخذ في الاعتبار التأثير الذي يهدد الذكاء الاصطناعي بإحداثه على صناعة الأخبار غير المستقرة بالفعل. وجد نموذج حديث من مجلة The Atlantic أنه إذا قام محرك بحث مثل Google بدمج الذكاء الاصطناعي في البحث، فسوف يجيب على استفسار المستخدم بنسبة 75٪ من الوقت دون الحاجة إلى النقر للوصول إلى موقعه على الويب.
ولكن ربما هناك يكون غرفة للنحت.
ينبغي أن يحصل الناشرون على أجورهم، وأن يحصلوا على أجور عادلة. على الرغم من ذلك، ألا توجد نتيجة يتم فيها دفع أجورهم، ويتمكن المنافسون لشاغلي وظائف الذكاء الاصطناعي – وكذلك الأكاديميين – من الوصول إلى نفس البيانات؟ كهؤلاء شاغلي الوظائف؟ وأرجو أن أعتقد ذلك. المنح هي طريقة واحدة. تعد عمليات فحص VC الأكبر حجمًا أمرًا آخر.
لا أستطيع أن أقول إنني أملك الحل، خاصة وأن المحاكم لم تقرر بعد ما إذا كان الاستخدام العادل – وإلى أي مدى – يحمي بائعي الذكاء الاصطناعي من مطالبات حقوق النشر. لكن من المهم أن نستخلص هذه الأشياء. وبخلاف ذلك، قد ينتهي الأمر بالصناعة إلى وضع يستمر فيه “هجرة الأدمغة” الأكاديمية بلا هوادة، ولا يتمكن سوى عدد قليل من الشركات القوية من الوصول إلى مجموعات واسعة من مجموعات التدريب القيمة.
اكتشاف المزيد من مجلة كوكان
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.