تحاول تغييرات Reddit القادمة حماية النظام الأساسي من برامج زحف الذكاء الاصطناعي
أعلن Reddit يوم الثلاثاء أنه يقوم بتحديث بروتوكول استبعاد الروبوتات (ملف robots.txt)، والذي يخبر روبوتات الويب الآلية ما إذا كان مسموحًا لها بالزحف إلى موقع ما.
تاريخيًا، تم استخدام ملف robots.txt للسماح لمحركات البحث بإخفاء موقع ما ثم توجيه الأشخاص إلى المحتوى. ومع ذلك، مع ظهور الذكاء الاصطناعي، يتم حذف مواقع الويب واستخدامها لتدريب النماذج دون الاعتراف بالمصدر الفعلي للمحتوى.
إلى جانب ملف robots.txt المحدث، سيستمر Reddit في تحديد المعدل وحظر برامج الروبوت وبرامج الزحف غير المعروفة من الوصول إلى نظامه الأساسي. أخبرت الشركة TechCrunch أن معدلات الروبوتات وبرامج الزحف ستكون محدودة أو محظورة إذا لم تلتزم بسياسة المحتوى العام الخاصة بـ Reddit ولم يكن لديها اتفاقية مع النظام الأساسي.
يقول موقع Reddit إن التحديث لا ينبغي أن يؤثر على غالبية المستخدمين أو الجهات الفاعلة ذات النية الحسنة، مثل الباحثين والمنظمات، مثل أرشيف الإنترنت. وبدلاً من ذلك، تم تصميم التحديث لردع شركات الذكاء الاصطناعي عن تدريب نماذجها اللغوية الكبيرة على محتوى Reddit. بالطبع، يمكن لبرامج زحف الذكاء الاصطناعي تجاهل ملف robots.txt الخاص بموقع Reddit.
يأتي هذا الإعلان بعد أيام قليلة من اكتشاف تحقيق أجرته Wired أن شركة Perplexity الناشئة في مجال البحث المدعوم بالذكاء الاصطناعي كانت تسرق المحتوى وتستخرجه. وجدت Wired أن Perplexity يبدو أنها تتجاهل طلبات عدم حذف موقعها على الويب، على الرغم من أنها منعت بدء التشغيل في ملف robots.txt الخاص بها. استجاب أرافيند سرينيفاس، الرئيس التنفيذي لشركة Perplexity، للادعاءات وقال إن ملف robots.txt ليس إطارًا قانونيًا.
لن تؤثر تغييرات Reddit القادمة على الشركات التي أبرمت معها اتفاقية. على سبيل المثال، لدى Reddit صفقة بقيمة 60 مليون دولار مع Google تسمح لعملاق البحث بتدريب نماذج الذكاء الاصطناعي الخاصة به على محتوى النظام الأساسي الاجتماعي. مع هذه التغييرات، يشير Reddit إلى الشركات الأخرى التي ترغب في استخدام بيانات Reddit للتدريب على الذكاء الاصطناعي بأنه سيتعين عليها الدفع.
وقال موقع Reddit في منشور مدونته: “يجب على أي شخص يصل إلى محتوى Reddit أن يلتزم بسياساتنا، بما في ذلك السياسات المعمول بها لحماية مستخدمي Redditors”. “نحن انتقائيون بشأن الأشخاص الذين نعمل معهم ونثق بهم من خلال الوصول على نطاق واسع إلى محتوى Reddit.”
لا يشكل هذا الإعلان مفاجأة، حيث أصدر Reddit سياسة جديدة قبل بضعة أسابيع تم تصميمها لتوجيه كيفية الوصول إلى بيانات Reddit واستخدامها من قبل الكيانات التجارية والشركاء الآخرين.
اكتشاف المزيد من مجلة كوكان
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.