بيانات التصنيف
كشف تحقيقٌ أجرته مجلة تايم أن شركة OpenAI، لبناء نظام أمان ضد المحتوى الضار (مثل الاعتداء الجنسي والعنف والعنصرية والتمييز الجنسي، إلخ)، استعانت بعمال كينيين متعاقدين يتقاضون أقل من دولارين أمريكيين في الساعة لتصنيف هذا المحتوى. استُخدمت هذه التصنيفات لتدريب نموذجٍ للكشف عن مثل هذا المحتوى مستقبلاً. تعرّض هؤلاء العمال المتعاقدون لمحتوى ضار وخطير لدرجة أنهم وصفوا التجربة بأنها "تعذيب". وكان شريك OpenAI في هذا المجال شركة Sama، وهي شركة بيانات تدريبية مقرها سان فرانسيسكو، كاليفورنيا.
كسر الحماية
يحاول برنامج ChatGPT رفض الرسائل التي قد تنتهك سياسة المحتوى الخاصة به. مع ذلك، تمكن بعض المستخدمين من اختراق البرنامج باستخدام تقنيات مختلفة لتعديل الرسائل، وذلك في أوائل ديسمبر 2022، ونجحوا في خداعه ليعطي تعليمات حول كيفية صنع زجاجة مولوتوف أو قنبلة نووية، أو لتوليد حجج على غرار النازيين الجدد. وقد حقق مراسل صحيفة تورنتو ستار نجاحًا متفاوتًا في حثّ ChatGPT على الإدلاء بتصريحات تحريضية بعد فترة وجيزة من إطلاقه: فقد تم خداع البرنامج لتأييد الغزو الروسي لأوكرانيا عام 2022، ولكن حتى عندما طُلب منه التفاعل مع سيناريو خيالي، رفض البرنامج توليد حجج لتبرير اتهام رئيس الوزراء الكندي جاستن ترودو بالخيانة. (ويكيبيديا)
تاريخ النشر: 18 فبراير 2023