يقوم Twitter بتطبيق نموذج مكافأة الأخطاء على التعلم الآلي، حيث أطلق موقع التدوين المصغر أول مسابقة مكافأة خوارزمية في الصناعة، وتم إنشاء التحدي لتحديد الأضرار المحتملة في خوارزمية اقتصاص الصور سيئة السمعة في Twitter، والتي تم التخلي عنها إلى حد كبير بعد إظهار التحيزات القائمة على الجنس والعرق وفقا لما نقله موقع TheNextWeb.
وتريد الشركة الآن تحفيز المستخدمين للعثور على المزيد من المخاطر غير المحددة للخوارزمية، سيحصل الفائزون في التحدي على جوائز نقدية تصل إلى 3500 دولار.
المسابقة هي الأولى في مجال تحيزات الذكاء الاصطناعي، لكن برامج المكافآت لها تاريخ طويل في أمن تكنولوجيا المعلومات.
وقالت جوتا ويليامز، مديرة المنتج في Twitter META (أخلاقيات التعلم الآلي والشفافية والمساءلة)، أن المبادرة مستوحاة من كيفية مساعدة مجتمعات البحث والمتسللين في مجال الأمان:
لطالما تم تشكيل تويتر من قبل الأشخاص الذين يستخدمونه ويعرفونه بشكل أفضل، لذلك نريد تنمية مجتمع مشابه، يركز على أخلاقيات تعلم الآلة ، لمساعدتنا في تحديد نطاق أوسع من المشكلات مما يمكننا القيام به بمفردنا، من خلال هذا التحدي ، نهدف إلى وضع سابقة في Twitter وفي الصناعة لتحديد استباقي وجماعي لأضرار الخوارزميات.
الاستفادة من المجتمع
لم تكن هذه المبادرة هي المرة الأولى التي يسعى فيها تويتر للحصول على دعم المجتمع للتخفيف من الأضرار الخوارزمية.
في مايو شارك فريق META أبحاثه ورمزه حول تحيزات خوارزمية اقتصاص الصورة حتى يتمكن الآخرون من التحقيق في المشكلة.
وتقدر خوارزمية الاقتصاص ما يريد الناس رؤيته أولاً داخل الصورة. تحدد هذه العملية الحسابية بعد ذلك كيفية اقتصاص الصورة إلى حجم يسهل مشاهدته.
وتم تدريب النموذج على بيانات تتبع العين البشرية للتنبؤ بدرجة الملوحة في جميع مناطق الصورة، ثم يختار النقطة ذات أعلى الدرجات كمركز المحصول.
وبعد تلقي التعليقات بأن الخوارزمية لا تخدم جميع الأشخاص بشكل منصف، حلل تويتر نموذج التحيزات، كشف الباحثون عن القضايا الأساسية التي تفضل الأفراد البيض على السود.
قال رومان تشودري، رئيس فريق META في Twitter: "نريد أن نأخذ هذا العمل خطوة إلى الأمام من خلال دعوة وتحفيز المجتمع للمساعدة في تحديد الأضرار المحتملة لهذه الخوارزمية بما يتجاوز ما حددناه بأنفسنا".
في التحدي سيتمكن المشاركون من الوصول إلى نموذج البروز في Twitter والرمز المستخدم لإنشاء محصول من الصورة. مهمتهم هي إثبات الأضرار المحتملة التي قد تنتجها مثل هذه الخوارزمية.
والهدف الرئيسي للمسابقة هو تطوير معايير يحركها المجتمع وأفضل الممارسات لتقييم نماذج ML، والجدير بالذكر أن تويتر أنشأ قاعدة تصنيف توضح الأضرار الخوارزمية بطريقة لم تكن موجودة من قبل.
يوجد بالفعل مجتمع كبير من قراصنة الذكاء الاصطناعي الأخلاقيين الذين يأمل تويتر في الاستفادة منه. ومع ذلك من الناحية التاريخية د، لم يتم تحفيزهم للقيام بهذا النوع من العمل بنفس طريقة قراصنة الأمن.
قال شودري: "في الواقع كان الناس يقومون بهذا النوع من العمل بأنفسهم لسنوات، لكن لم يكافأوا أو يدفعوا مقابل ذلك".
سيضيف إدخال المكافآت النقدية المزيد من التشجيع، كما يريد Chowdhury تعزيز نهج أكثر شمولاً واستباقية للتخفيف من مخاطر الخوارزميات:
وتعد برامج المكافآت مثل هذا البرنامج حاسمة في المساعدة على زيادة الوعي بالأضرار والتحيزات التي قد تكون موجودة في الخوارزميات التي تتجاوز النطاق الحالي للتجارب الحية والفهم.
تم أضافة تعليقك سوف يظهر بعد المراجعة