تكنلوجيا الويب

تريد صحيفة نيويورك تايمز أن تقوم شركتا OpenAI وMicrosoft بدفع تكاليف بيانات التدريب


ترفع صحيفة نيويورك تايمز دعوى قضائية ضد شركة OpenAI ومعاونها الوثيق (والمستثمر)، شركة مايكروسوفت، بدعوى انتهاك قانون حقوق الطبع والنشر من خلال تدريب نماذج الذكاء الاصطناعي التوليدية على محتوى التايمز.

في الدعوى المرفوعة أمام محكمة المقاطعة الفيدرالية في مانهاتن، تؤكد صحيفة التايمز أن الملايين من مقالاتها تم استخدامها لتدريب نماذج الذكاء الاصطناعي، بما في ذلك تلك التي تدعم ChatGPT التي تحظى بشعبية كبيرة في OpenAI وCopilot من Microsoft، دون موافقتها. وتدعو التايمز OpenAI وMicrosoft إلى “تدمير” النماذج وبيانات التدريب التي تحتوي على المواد المخالفة وتحمل المسؤولية عن “مليارات الدولارات من الأضرار القانونية والفعلية” المتعلقة بـ “النسخ والاستخدام غير القانوني لأعمال التايمز ذات القيمة الفريدة”. “.

وجاء في شكوى التايمز: “إذا لم تتمكن التايمز وغيرها من المؤسسات الإخبارية من إنتاج صحافتها المستقلة وحمايتها، فسيكون هناك فراغ لا يمكن لأي كمبيوتر أو ذكاء اصطناعي أن يملأه”. “سيتم إنتاج صحافة أقل، وستكون التكلفة التي يتحملها المجتمع هائلة”.

نماذج الذكاء الاصطناعي التوليدية “تتعلم” من الأمثلة إلى المقالات الحرفية والأكواد ورسائل البريد الإلكتروني والمقالات والمزيد، ويبحث البائعون مثل OpenAI عن الويب بحثًا عن ملايين إلى مليارات من هذه الأمثلة لإضافتها إلى مجموعات التدريب الخاصة بهم. بعض الأمثلة موجودة في المجال العام. والبعض الآخر ليس كذلك، أو يخضع لتراخيص مقيدة تتطلب الاستشهاد أو أشكالًا محددة من التعويض.

يجادل البائعون بأن مبدأ الاستخدام العادل يوفر حماية شاملة لممارسات تجريف الويب الخاصة بهم. أصحاب حقوق الطبع والنشر يختلفون؛ تستخدم المئات من المؤسسات الإخبارية الآن تعليمات برمجية لمنع OpenAI وGoogle وغيرهما من مسح مواقعهم الإلكترونية بحثًا عن بيانات التدريب.

وقد أدى الصراع بين البائع والمنتج إلى عدد متزايد من المعارك القانونية، وآخرها معركة التايمز.

انضمت الممثلة سارة سيلفرمان إلى دعويين قضائيتين في يوليو/تموز تتهمان Meta وOpenAI بـ “ابتلاع” مذكرات سيلفرمان لتدريب نماذج الذكاء الاصطناعي الخاصة بهما. وفي دعوى منفصلة، ​​ادعى آلاف الروائيين، بما في ذلك جوناثان فرانزين وجون غريشام، أن شركة OpenAI حصلت على عملهم كبيانات تدريبية دون إذنهم أو علمهم. والعديد من المبرمجين لديهم قضية مستمرة ضد مايكروسوفت، وOpenAI، وGitHub بشأن Copilot، وهي أداة لتوليد التعليمات البرمجية مدعومة بالذكاء الاصطناعي، والتي يقول المدعون إنها تم تطويرها باستخدام كودهم المحمي بـ IP.

على الرغم من أن صحيفة التايمز ليست أول من رفع دعوى قضائية ضد بائعي الذكاء الاصطناعي بسبب انتهاكات مزعومة للملكية الفكرية تتضمن أعمالًا مكتوبة، إلا أنها أكبر ناشر متورط في مثل هذه الدعوى حتى الآن – وواحدة من أوائل الشركات التي سلطت الضوء على الضرر المحتمل لعلامتها التجارية من خلال “الهلوسة”، أو حقائق مختلقة من نماذج الذكاء الاصطناعي التوليدية.

تشير شكوى التايمز إلى العديد من الحالات التي قدم فيها برنامج Bing Chat من Microsoft (المعروف الآن باسم Copilot)، والذي يدعمه نموذج OpenAI، معلومات غير صحيحة قيل أنها جاءت من The Times – بما في ذلك نتائج “أكثر 15 نوعًا من الأطعمة الصحية للقلب”. “، 12 منها لم يتم ذكرها في أي مقال في صحيفة التايمز.

تشير صحيفة التايمز أيضًا إلى أن OpenAI وMicrosoft يعملان بشكل فعال على بناء منافسين لناشري الأخبار باستخدام أعمال التايمز، مما يضر بأعمال التايمز من خلال توفير معلومات لا يمكن الوصول إليها عادة دون اشتراك – وهي معلومات لا يتم الاستشهاد بها دائمًا، في بعض الأحيان. علاوة على ذلك، يتم تحقيق الدخل منها وتجريدها من الروابط التابعة التي تستخدمها The Times لتوليد العمولات.

وكما تشير شكوى التايمز، فإن نماذج الذكاء الاصطناعي التوليدية تميل إلى اجترار بيانات التدريب، على سبيل المثال، إعادة إنتاج نتائج حرفية تقريبًا من المقالات. وبعيدًا عن القلس، قامت OpenAI في مناسبة واحدة على الأقل بتمكين مستخدمي ChatGPT عن غير قصد من الالتفاف حول المحتوى الإخباري المحمي بنظام حظر الاشتراك غير المدفوع.

تقول الشكوى: “يسعى المدعى عليهم إلى الاستفادة مجانًا من استثمار التايمز الضخم في صحافتها”، متهمة OpenAI وMicrosoft “باستخدام محتوى التايمز دون مقابل لإنشاء منتجات تحل محل التايمز وتسرق الجماهير منها”.

تقع التأثيرات على أعمال الاشتراك في الأخبار – وحركة مرور الويب للناشر – في قلب دعوى مماثلة بشكل عرضي رفعها الناشرون في وقت سابق من الشهر ضد Google. في هذه القضية، جادل المدعى عليهم، مثل صحيفة التايمز، بأن تجارب الذكاء الاصطناعي العامة من Google، بما في ذلك برنامج Bard chatbot الذي يعمل بالذكاء الاصطناعي وSearch Geneative Experience، تسحب محتوى الناشرين والقراء وعائدات الإعلانات من خلال وسائل مانعة للمنافسة.

هناك مصداقية لتأكيدات الناشرين. وجد نموذج حديث من مجلة The Atlantic أنه إذا قام محرك بحث مثل Google بدمج الذكاء الاصطناعي في البحث، فسوف يجيب على استفسار المستخدم بنسبة 75٪ من الوقت دون الحاجة إلى النقر للوصول إلى موقعه على الويب. يقدر الناشرون في دعوى Google أنهم سيخسرون ما يصل إلى 40% من حركة المرور الخاصة بهم.

وبدلاً من محاربة البائعين في المحكمة، اختارت بعض وسائل الإعلام توقيع اتفاقيات ترخيص معهم. وفي شهر يوليو/تموز، أبرمت وكالة أسوشيتد برس صفقة مع شركة أوبن إيه آي، كما فعلت شركة أكسل سبرينغر، الناشر الألماني الذي يمتلك مجلة بوليتيكو وبيزنس إنسايدر، بالمثل هذا الشهر.

وتقول صحيفة The Times في شكواها إنها حاولت التوصل إلى ترتيب ترخيص مع Microsoft وOpenAI في أبريل، لكن المحادثات لم تكن مثمرة في النهاية.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى