×

تقول Reddit إنها حققت 203 ملايين دولار حتى الآن من ترخيص بياناتها

تقول Reddit إنها حققت 203 ملايين دولار حتى الآن من ترخيص بياناتها

[ad_1]

إن آفاق Reddit وهي تتجه نحو الإدراج في سوق الأسهم لها علاقة كبيرة بالعلاقات مع بائعي الذكاء الاصطناعي مثل OpenAI أكثر مما قد يتوقعه المرء.

في نشرة الاكتتاب العام التي قدمتها اليوم إلى هيئة الأوراق المالية والبورصة الأمريكية، أكدت Reddit مرارًا وتكرارًا على مقدار ما تعتقد أنها ستكسبه – وما اكتسبته – من اتفاقيات ترخيص البيانات مع الشركات التي تدرب نماذج الذكاء الاصطناعي على أكثر من مليار منشور وأكثر من 16 مشاركة. مليار تعليق.

وجاء في نشرة الإصدار: “في يناير 2024، دخلنا في بعض ترتيبات ترخيص البيانات بقيمة عقد إجمالية قدرها 203.0 مليون دولار وشروط تتراوح من سنتين إلى ثلاث سنوات”. “نتوقع أن يتم تحقيق ما لا يقل عن 66.4 مليون دولار من الإيرادات خلال السنة المنتهية في 31 ديسمبر 2024 والباقي بعد ذلك.”

الآن، من غير المعروف ما هو بائعي الذكاء الاصطناعي الذين يقومون بترخيص البيانات من Reddit حتى الآن. في وقت سابق من هذا الأسبوع، ذكرت بلومبرج ورويترز أن “شركة ذكاء اصطناعي كبيرة لم تذكر اسمها” – ربما جوجل – قد أبرمت اتفاقية ترخيص تبلغ قيمتها حوالي 60 مليون دولار على أساس سنوي. لكن OpenAI لن تكون عميلاً مفاجئًا أيضًا، لا سيما بالنظر إلى أن الرئيس التنفيذي لشركة OpenAI Sam Altman يمتلك حصة 8.7% في Reddit (مما يجعله ثالث أكبر مساهم) وكان ذات يوم عضوًا في مجلس إدارة الشركة.

لماذا تعتبر بيانات Reddit ذات قيمة؟ كما يوضح Reddit، فإن نماذج الذكاء الاصطناعي “تتعلم” من الأمثلة لصياغة المقالات والأكواد ورسائل البريد الإلكتروني والمقالات والمزيد، ويبحث البائعون مثل OpenAI في الويب عن ملايين إلى المليارات من هذه الأمثلة لإضافتها إلى مجموعات التدريب الخاصة بهم. بعض الأمثلة موجودة في المجال العام. البعض الآخر ليس كذلك، أو – في حالة محتوى Reddit – يخضع لتراخيص مقيدة تتطلب الاستشهاد أو أشكالًا محددة من التعويض.

لم يسمح Reddit سابقًا بالوصول إلى بياناته لأغراض التدريب على الذكاء الاصطناعي. لكنها عكست مسارها في العام الماضي، بحجة أن بياناتها لا ينبغي أن تكون – على حد تعبير الرئيس التنفيذي ستيف هوفمان – “[given] لبعض من أكبر الشركات في العالم مجانًا.

“[Our] إن واجهات برمجة التطبيقات للبيانات قادرة على توفير الوصول في الوقت الفعلي إلى الموضوعات المتطورة والديناميكية مثل الرياضة والأفلام والأخبار والأزياء وأحدث الاتجاهات. “نحن نعتقد أن مجموعة Reddit الضخمة من بيانات المحادثة والمعرفة ستستمر في لعب دور في التدريب وتحسين نماذج اللغات الكبيرة. ومع تحديث المحتوى الخاص بنا ونموه يوميًا، نتوقع أن ترغب العارضات في عكس هذه الأفكار الجديدة وتحديث تدريبهن باستخدام بيانات Reddit.

يتجه منتجو المحتوى، من مكتبات الوسائط المالية إلى ناشري الأخبار، بشكل متزايد إلى اتفاقيات ترخيص البيانات مع بائعي الذكاء الاصطناعي، حيث تهدد روبوتات الدردشة مثل ChatGPT من OpenAI وGemini من Google باستنزاف حركة المرور. وجد نموذج حديث من مجلة The Atlantic أنه إذا قام محرك بحث مثل Google بدمج الذكاء الاصطناعي في البحث، فسوف يجيب على استفسار المستخدم بنسبة 75٪ من الوقت دون الحاجة إلى النقر للوصول إلى موقعه على الويب.

وفي المقابل، تم تحفيز البائعين إلى متابعة اتفاقيات الترخيص حيث يواجهون طوفانًا من الدعاوى القضائية التي تزعم أنه ليس لديهم أي مبرر قانوني لتدريب نماذجهم على البيانات دون إذن أو دفع. في الآونة الأخيرة، اتهمت صحيفة نيويورك تايمز شركة OpenAI ببناء منافسين فعالين لناشري الأخبار باستخدام أعمالها، مما أضر بأعمالها.

لدى OpenAI، على سبيل المثال، اتفاقيات معمول بها مع معرض الصور Shutterstock بالإضافة إلى الناشرين بما في ذلك Axel Springer، مالك Politico وBusiness Insider. ومع ذلك، يُقال إن التراخيص صغيرة جدًا، حيث تصل قيمتها إلى 5 ملايين دولار سنويًا.

[ad_2]

إرسال التعليق

You May Have Missed