هذا الأسبوع في الذكاء الاصطناعي: من السهل جدًا عمل تزييف عميق لكامالا هاريس
مرحبًا يا رفاق، مرحبًا بكم في النشرة الإخبارية المنتظمة للذكاء الاصطناعي الخاصة بـ TechCrunch. إذا كنت تريد أن يصل هذا إلى بريدك الوارد كل يوم أربعاء، فقم بالتسجيل هنا.
لقد كان من السهل جدًا إنشاء مقطع صوتي مقنع لـ Kamala Harris في يوم الانتخابات. لقد كلفني الأمر 5 دولارات واستغرق أقل من دقيقتين، مما يوضح كيف أن الذكاء الاصطناعي التوليدي الرخيص والمنتشر في كل مكان قد فتح الباب على مصراعيه أمام المعلومات المضللة.
لم يكن إنشاء تزييف عميق لهاريس هو هدفي الأصلي. كنت ألعب مع Cartesia’s Voice Changer، وهو نموذج يحول صوتك إلى صوت مختلف مع الحفاظ على النغمة الأصلية. يمكن أن يكون هذا الصوت الثاني “استنساخًا” لشخص آخر – سيقوم Cartesia بإنشاء صوت رقمي مزدوج من أي تسجيل مدته 10 ثوانٍ.
لذا، تساءلت، هل سيحول Voice Changer صوتي إلى صوت هاريس؟ لقد دفعت 5 دولارات لفتح ميزة استنساخ الصوت في Cartesia، وقمت بإنشاء نسخة من صوت Harris باستخدام خطابات الحملة الأخيرة، واخترت هذا الاستنساخ كمخرج في Voice Changer.
عملت مثل السحر:
أنا واثق من أن Cartesia لم تكن تنوي استخدام أدواتها بهذه الطريقة. لتمكين استنساخ الصوت، يتطلب Cartesia أن تحدد مربعًا يشير إلى أنك لن تقوم بإنشاء أي شيء ضار أو غير قانوني وأنك توافق على استنساخ تسجيلات كلامك.
لكن هذا مجرد نظام شرف. في غياب أي ضمانات حقيقية، لا يوجد ما يمنع أي شخص من إنشاء أكبر عدد ممكن من التزييف العميق “الضار أو غير القانوني” كما يرغب.
هذه مشكلة، فغني عن القول. إذن ما هو الحل؟ هل هناك واحد؟ يمكن لـ Cartesia تنفيذ التحقق الصوتي، كما فعلت بعض المنصات الأخرى. ولكن بحلول الوقت الذي يحدث فيه ذلك، من المحتمل أن تظهر أداة جديدة لاستنساخ الصوت غير مقيدة.
لقد تحدثت عن هذه المشكلة بالذات مع الخبراء في مؤتمر Disrupt الذي عقدته TC الأسبوع الماضي. كان البعض يدعم فكرة العلامات المائية غير المرئية بحيث يكون من الأسهل معرفة ما إذا كان المحتوى قد تم إنشاؤه بواسطة الذكاء الاصطناعي. وأشار آخرون إلى قوانين الإشراف على المحتوى مثل قانون السلامة عبر الإنترنت في المملكة المتحدة، والتي قالوا إنها قد تساعد في وقف موجة التضليل.
اعتبرني متشائمًا، لكني أعتقد أن تلك السفن قد أبحرت. نحن ننظر إلى الأمر، كما قال الرئيس التنفيذي لمركز مكافحة الكراهية الرقمية عمران أحمد، “آلة الثيران الدائمة”.
تنتشر المعلومات المضللة بمعدل ينذر بالخطر. تشمل بعض الأمثلة البارزة من العام الماضي شبكة الروبوتات على X التي تستهدف الانتخابات الفيدرالية الأمريكية والبريد الصوتي العميق للرئيس جو بايدن الذي يثبط سكان نيو هامبشاير عن التصويت. لكن الناخبين الأمريكيين والأشخاص ذوي الخبرة في مجال التكنولوجيا ليسوا أهدافًا لمعظم هذا المحتوى، وفقًا لتحليل True Media.org، لذا فإننا نميل إلى التقليل من أهمية وجوده في أماكن أخرى.
نما حجم التزييف العميق الناتج عن الذكاء الاصطناعي بنسبة 900% بين عامي 2019 و2020، وفقًا لبيانات المنتدى الاقتصادي العالمي.
وفي الوقت نفسه، هناك عدد قليل نسبيًا من قوانين استهداف التزييف العميق في الكتب. ومن المتوقع أن يصبح اكتشاف التزييف العميق بمثابة سباق تسلح لا ينتهي أبدًا. من المؤكد أن بعض الأدوات لن تختار استخدام تدابير السلامة مثل العلامات المائية، أو سيتم نشرها مع وضع التطبيقات الضارة في الاعتبار.
بعيدًا عن التغيير الجذري، أعتقد أن أفضل ما يمكننا فعله هو أن نكون متشككين بشدة بشأن ما هو موجود – وخاصة المحتوى واسع الانتشار. لم يعد الأمر سهلاً كما كان من قبل لتمييز الحقيقة من الخيال عبر الإنترنت. لكننا لا نزال نتحكم في ما نشاركه مقابل ما لا نشاركه. وهذا أكثر تأثيرًا مما قد يبدو.
أخبار
مراجعة بحث ChatGPT: قام زميلي ماكس بتجربة تكامل بحث OpenAI الجديد لـ ChatGPT، ChatGPT Search، في جولة. لقد وجدها مثيرة للإعجاب في بعض النواحي، ولكنها غير موثوقة بالنسبة للاستعلامات القصيرة التي تحتوي على بضع كلمات فقط.
طائرات أمازون بدون طيار في فينيكس: بعد أشهر قليلة من إنهاء برنامج التسليم المعتمد على الطائرات بدون طيار، تقول شركة Prime Air، في كاليفورنيا، إنها بدأت في إجراء عمليات التسليم لعملاء محددين عبر الطائرات بدون طيار في فينيكس، أريزونا.
ينضم قائد Meta AR السابق إلى OpenAI: أعلنت الرئيسة السابقة لجهود نظارات الواقع المعزز في Meta، بما في ذلك Orion، يوم الاثنين أنها ستنضم إلى OpenAI لقيادة الروبوتات والأجهزة الاستهلاكية. تأتي هذه الأخبار بعد أن قامت شركة OpenAI بتعيين المؤسس المشارك لمنافس X (تويتر سابقًا) Pebble.
تم إيقافه عن طريق الحساب: في Reddit AMA، اعترف الرئيس التنفيذي لشركة OpenAI Sam Altman بأن الافتقار إلى القدرة الحاسوبية هو أحد العوامل الرئيسية التي تمنع الشركة من شحن المنتجات بقدر ما تريد.
الملخصات التي تم إنشاؤها بواسطة الذكاء الاصطناعي: أطلقت أمازون “X-Ray Recaps”، وهي ميزة توليدية مدعومة بالذكاء الاصطناعي تعمل على إنشاء ملخصات موجزة لمواسم تلفزيونية كاملة، وحلقات فردية، وحتى أجزاء من الحلقات.
ارتفاعات إنسانية أسعار هايكو: لقد وصل أحدث نموذج للذكاء الاصطناعي من Anthropic: Claude 3.5 Haiku. ولكنه أغلى من الجيل الأخير، وعلى عكس نماذج Anthropic الأخرى، فإنه لا يمكنه تحليل الصور أو الرسوم البيانية أو الرسوم البيانية حتى الآن.
ابل تستحوذ على Pixelmator: أعلن محرر الصور Pixelmator المدعوم بالذكاء الاصطناعي يوم الجمعة أن شركة Apple قد استحوذت عليه. وتأتي هذه الصفقة في الوقت الذي أصبحت فيه شركة Apple أكثر جرأة بشأن دمج الذكاء الاصطناعي في تطبيقات التصوير الخاصة بها.
“وكيل” اليكسا: ألمح الرئيس التنفيذي لشركة أمازون آندي جاسي الأسبوع الماضي إلى نسخة “وكيلة” محسنة من مساعد Alexa الخاص بالشركة – وهو إصدار يمكنه اتخاذ إجراءات نيابة عن المستخدم. يقال إن Alexa المتجدد واجه تأخيرات وانتكاسات فنية، وقد لا يتم إطلاقه حتى وقت ما في عام 2025.
ورقة بحثية للأسبوع
يمكن للنوافذ المنبثقة على الويب أن تخدع الذكاء الاصطناعي أيضًا، وليس فقط الأجداد.
في ورقة بحثية جديدة، أظهر باحثون من جامعة جورجيا للتكنولوجيا وجامعة هونغ كونغ وستانفورد أن “وكلاء” الذكاء الاصطناعي – نماذج الذكاء الاصطناعي التي يمكنها إكمال المهام – يمكن اختطافهم من خلال “النوافذ المنبثقة الخصومة” التي توجه النماذج للقيام بأشياء مثل تحميل ملحقات الملفات الضارة.
من الواضح تمامًا أن بعض هذه النوافذ المنبثقة عبارة عن مصائد للعين البشرية، لكن الذكاء الاصطناعي ليس على هذا القدر من التمييز. يقول الباحثون إن نماذج تحليل الصور والنصوص التي اختبروها فشلت في تجاهل النوافذ المنبثقة بنسبة 86% من الوقت، ونتيجة لذلك، كانت احتمالية إكمال المهام أقل بنسبة 47%.
لم تكن الدفاعات الأساسية، مثل توجيه النماذج لتجاهل النوافذ المنبثقة، فعالة. كتب المؤلفون المشاركون في الدراسة: “لا يزال نشر وكلاء استخدام الكمبيوتر يعاني من مخاطر كبيرة، وهناك حاجة إلى أنظمة وكيل أكثر قوة لضمان سير عمل الوكيل الآمن”.
نموذج الاسبوع
أعلنت شركة Meta بالأمس أنها تعمل مع شركاء لجعل نماذج Llama “المفتوحة” للذكاء الاصطناعي متاحة لتطبيقات الدفاع. واليوم، أعلن أحد هؤلاء الشركاء، وهو Scale AI، عن نموذج Defense Llama، وهو نموذج مبني على أعلى لعبة Meta’s Llama 3 “تم تخصيصه وضبطه بدقة لدعم مهام الأمن القومي الأمريكي”.
يقول سكيل إن Defense Llama، المتوفر في منصة Chatbot التابعة لشركة Scale’s Donavan لعملاء الحكومة الأمريكية، تم تحسينه للتخطيط للعمليات العسكرية والاستخباراتية. يمكن لـ Defense Llama الإجابة على الأسئلة المتعلقة بالدفاع، على سبيل المثال، مثل كيف يمكن للخصم أن يخطط لهجوم ضد قاعدة عسكرية أمريكية.
إذًا ما الذي يجعل اللاما الدفاعية مختلفة عن اللاما المخزونة؟ حسنًا، يقول Scale إنه تم ضبطه على المحتوى الذي قد يكون ذا صلة بالعمليات العسكرية، مثل العقيدة العسكرية والقانون الإنساني الدولي، بالإضافة إلى قدرات الأسلحة وأنظمة الدفاع المختلفة. كما أنه ليس مقيدًا بالإجابة على الأسئلة المتعلقة بالحرب، كما قد يكون برنامج الدردشة الآلي المدني:
ومع ذلك، ليس من الواضح من الذي قد يميل إلى استخدامه.
لقد كان الجيش الأمريكي بطيئا في تبني الذكاء الاصطناعي التوليدي – وكان متشككا في عائد الاستثمار. حتى الآن، يعد الجيش الأمريكي الفرع الوحيد من القوات المسلحة الأمريكية الذي يستخدم الذكاء الاصطناعي بشكل مولد. وقد أعرب المسؤولون العسكريون عن مخاوفهم بشأن نقاط الضعف الأمنية في النماذج التجارية، فضلاً عن التحديات القانونية المرتبطة بمشاركة البيانات الاستخباراتية وعدم القدرة على التنبؤ بالنماذج عند مواجهة الحالات المتطورة.
الاستيلاء على حقيبة
أصدرت Spawning AI، وهي شركة ناشئة تعمل على إنشاء أدوات لتمكين المبدعين من إلغاء الاشتراك في تدريب الذكاء الاصطناعي التوليدي، مجموعة بيانات صور لتدريب نماذج الذكاء الاصطناعي التي تدعي أنها مجال عام بالكامل.
يتم تدريب معظم نماذج الذكاء الاصطناعي التوليدية على بيانات الويب العامة، والتي قد يكون بعضها محميًا بحقوق الطبع والنشر أو بموجب ترخيص مقيد. تجادل شركة OpenAI والعديد من بائعي الذكاء الاصطناعي الآخرين بأن مبدأ الاستخدام العادل يحميهم من مطالبات حقوق الطبع والنشر. لكن هذا لم يمنع أصحاب البيانات من رفع دعاوى قضائية.
تقول Spawning AI إن مجموعة بياناتها التدريبية المكونة من 12.4 مليون زوج من التعليقات التوضيحية للصور تتضمن فقط محتوى “ذو مصدر معروف” و”مُصنف بحقوق واضحة لا لبس فيها” لتدريب الذكاء الاصطناعي. وعلى عكس بعض مجموعات البيانات الأخرى، فهي متاحة أيضًا للتنزيل من مضيف مخصص، مما يلغي الحاجة إلى استخلاصها من الويب.
“من الجدير بالذكر أن حالة المجال العام لمجموعة البيانات جزء لا يتجزأ من هذه الأهداف الأكبر” ، كتب Spawning في منشور بالمدونة. “ستستمر مجموعات البيانات التي تتضمن صورًا محمية بحقوق الطبع والنشر في الاعتماد على تجريف الويب لأن استضافة الصور قد تنتهك حقوق الطبع والنشر.”
يمكن العثور على مجموعة بيانات Spawning، PD12M، ونسخة منسقة للصور “الممتعة من الناحية الجمالية”، PD3M، على هذا الرابط.
اكتشاف المزيد من مجلة كوكان
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.