قام OpenAI عن طريق الخطأ بحذف الأدلة المحتملة في دعوى حقوق الطبع والنشر التي نشرتها صحيفة نيويورك تايمز
يقول محامو صحيفة نيويورك تايمز وديلي نيوز، الذين يقاضون شركة OpenAI بزعم أنها ألغت أعمالهم لتدريب نماذج الذكاء الاصطناعي الخاصة بها دون إذن، إن مهندسي OpenAI حذفوا عن طريق الخطأ البيانات التي يحتمل أن تكون ذات صلة بالقضية.
في وقت سابق من هذا الخريف، وافقت شركة OpenAI على توفير جهازين افتراضيين حتى يتمكن مستشاري The Times وDaily News من إجراء عمليات بحث عن المحتوى المحمي بحقوق الطبع والنشر في مجموعات التدريب الخاصة بالذكاء الاصطناعي. (الأجهزة الافتراضية هي أجهزة كمبيوتر قائمة على البرامج موجودة ضمن نظام تشغيل كمبيوتر آخر، وغالبًا ما تستخدم لأغراض الاختبار، والنسخ الاحتياطي للبيانات، وتشغيل التطبيقات). وفي رسالة، يقول محامو الناشرين إنهم والخبراء الذين عينوهم أنفقوا أكثر من 150 ساعة منذ 1 نوفمبر في البحث في بيانات تدريب OpenAI.
لكن في 14 نوفمبر، قام مهندسو OpenAI بمسح جميع بيانات بحث الناشرين المخزنة على إحدى الأجهزة الافتراضية، وفقًا للرسالة المذكورة أعلاه، والتي تم تقديمها إلى المحكمة الجزئية الأمريكية للمنطقة الجنوبية من نيويورك في وقت متأخر من يوم الأربعاء.
حاول OpenAI استعادة البيانات، وكان ناجحًا في الغالب. ومع ذلك، نظرًا لأن بنية المجلدات وأسماء الملفات قد فقدت “بشكل لا رجعة فيه”، فإن البيانات المستردة “لا يمكن استخدامها لتحديد المكان الذي تم استخدام المقالات المنسوخة للمدعين في الأخبار لبناءها”. [OpenAI’s] النماذج “، في الرسالة.
وكتب محامي التايمز وديلي نيوز: “لقد أُجبر المدعون في مجال الأخبار على إعادة إنشاء عملهم من الصفر باستخدام ساعات طويلة من العمل ووقت معالجة الكمبيوتر”. “لقد علم المدعون بالأمس فقط أن البيانات المستردة غير قابلة للاستخدام وأنه يجب إعادة إنجاز عمل الخبراء والمحامين لمدة أسبوع كامل، ولهذا السبب يتم تقديم هذه الرسالة التكميلية اليوم.”
يوضح محامي المدعين أنه ليس لديهم أي سبب للاعتقاد بأن الحذف كان مقصودًا. لكنهم يقولون إن الحادث يؤكد أن OpenAI “في أفضل وضع للبحث في مجموعات البيانات الخاصة بها” بحثًا عن محتوى يحتمل أن يمثل انتهاكًا باستخدام أدواتها الخاصة.
ورفض متحدث باسم OpenAI الإدلاء ببيان.
في هذه الحالة وغيرها، أكدت شركة OpenAI أن نماذج التدريب التي تستخدم البيانات المتاحة للجمهور – بما في ذلك المقالات من The Times وDaily News – هي استخدام عادل. بمعنى آخر، عند إنشاء نماذج مثل GPT-4o، التي “تتعلم” من مليارات الأمثلة من الكتب الإلكترونية والمقالات والمزيد لإنشاء نصوص تبدو بشرية، تعتقد OpenAI أنه ليس مطلوبًا الترخيص أو الدفع مقابل ذلك الأمثلة – حتى لو كانت تجني المال من تلك النماذج.
ومع ذلك، فقد وقعت OpenAI اتفاقيات ترخيص مع عدد متزايد من الناشرين الجدد، بما في ذلك وكالة Associated Press، ومالك Business Insider Axel Springer، وFinancial Times، والشركة الأم لشركة People Dotdash Meredith، وNews Corp. وقد رفضت OpenAI وضع شروط هذه الاتفاقيات. الصفقات العامة، ولكن ورد أن أحد شركاء المحتوى، Dotdash، يتقاضى ما لا يقل عن 16 مليون دولار سنويًا.
لم تؤكد شركة OpenAI أو تنفي قيامها بتدريب أنظمة الذكاء الاصطناعي الخاصة بها على أي أعمال محددة محمية بحقوق الطبع والنشر دون إذن.
اكتشاف المزيد من مجلة كوكان
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.