وجدت OpenAI أن GPT-4o يقوم ببعض الأشياء الغريبة حقًا في بعض الأحيان
يعد نموذج GPT-4o من OpenAI، وهو نموذج الذكاء الاصطناعي التوليدي الذي يعمل على تشغيل ألفا لوضع الصوت المتقدم الذي تم إطلاقه مؤخرًا في ChatGPT، هو أول نموذج تم تدريبه من قبل الشركة على البيانات الصوتية والنصية والصورة. وهذا يدفعه إلى التصرف بطرق غريبة أحياناً، مثل تقليد صوت الشخص الذي يتحدث إليه أو الصراخ بشكل عشوائي في منتصف المحادثة.
وفي تقرير “الفريق الأحمر” الجديد الذي يوثق تحقيقات نقاط القوة والمخاطر في النموذج، يكشف OpenAI عن بعض المراوغات الغريبة في GPT-4o، مثل استنساخ الصوت المذكور أعلاه. في حالات نادرة – خاصة عندما يتحدث شخص ما إلى GPT-4o في “بيئة ذات ضوضاء عالية في الخلفية”، مثل سيارة على الطريق – سوف يحاكي GPT-4o صوت المستخدم، كما تقول OpenAI. لماذا؟ حسنًا، تنسب OpenAI الأمر إلى النموذج الذي يكافح من أجل فهم الكلام المشوه. عادلة بما فيه الكفاية!
استمع إلى ما يبدو عليه الأمر في العينة أدناه (من التقرير). غريب، أليس كذلك؟
للتوضيح، GPT-4o لا يقوم بذلك الآن، على الأقل ليس في وضع الصوت المتقدم. أخبر متحدث باسم OpenAI موقع TechCrunch أن الشركة أضافت “تخفيفًا على مستوى النظام” للسلوك.
GPT-4o أيضًا عرضة لتوليد “أصوات غير لفظية” ومؤثرات صوتية مزعجة أو غير مناسبة، مثل الأنين المثير والصراخ العنيف وطلقات نارية، عندما يتم طلبه بطرق محددة. يقول OpenAI أن هناك أدلة تشير إلى أن هذا النموذج عمومًا يرفض طلبات إنشاء مؤثرات صوتية، لكنه يقر بأن بعض الطلبات يتم تنفيذها بالفعل.
قد ينتهك GPT-4o أيضًا حقوق الطبع والنشر للموسيقى، أو ربما لو لم يطبق OpenAI مرشحات لمنع ذلك. في التقرير، قالت OpenAI إنها أصدرت تعليمات إلى GPT-4o بعدم الغناء للألفا المحدودة لوضع الصوت المتقدم، وذلك لتجنب نسخ أسلوب و/أو نغمة و/أو جرس الفنانين المعروفين.
وهذا يعني ضمنًا – لكنه لا يؤكد بشكل قاطع – أن OpenAI قامت بتدريب GPT-4o على مواد محمية بحقوق الطبع والنشر. من غير الواضح ما إذا كانت OpenAI تنوي رفع القيود عندما يتم طرح وضع الصوت المتقدم لمزيد من المستخدمين في الخريف، كما أُعلن سابقًا.
“لحساب طريقة الصوت في GPT-4o، قمنا بتحديث بعض المرشحات المستندة إلى النص للعمل على المحادثات الصوتية [and] “تم إنشاء مرشحات لاكتشاف وحظر المخرجات التي تحتوي على موسيقى” ، كتب OpenAI في التقرير. “لقد قمنا بتدريب GPT-4o على رفض طلبات المحتوى المحمي بحقوق الطبع والنشر، بما في ذلك الصوت، بما يتوافق مع ممارساتنا الأوسع.”
ومن الجدير بالذكر أن OpenAI قالت مؤخرًا أنه سيكون من “المستحيل” تدريب النماذج الرائدة اليوم دون استخدام مواد محمية بحقوق الطبع والنشر. على الرغم من أن الشركة لديها عدد من اتفاقيات الترخيص مع موفري البيانات، إلا أنها تؤكد أيضًا أن الاستخدام العادل هو دفاع معقول ضد الاتهامات بأنها تدرب على البيانات المحمية بالملكية الفكرية، بما في ذلك أشياء مثل الأغاني، دون إذن.
تقرير الفريق الأحمر – لما يستحقه، بالنظر إلى خيول OpenAI في السباق – يفعل ارسم صورة عامة لنموذج الذكاء الاصطناعي الذي أصبح أكثر أمانًا من خلال وسائل التخفيف والضمانات المختلفة. يرفض GPT-4o التعرف على الأشخاص بناءً على الطريقة التي يتحدثون بها، على سبيل المثال، ويرفض الإجابة على الأسئلة المحملة مثل “ما مدى ذكاء هذا المتحدث؟” كما أنه يحظر أيضًا الحث على استخدام لغة عنيفة ومشحونة جنسيًا، ولا يسمح بفئات معينة من المحتوى، مثل المناقشات المتعلقة بالتطرف وإيذاء النفس تمامًا.
اكتشاف المزيد من مجلة كوكان
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.