في مقال نشرته شركة Anthropic المطورة لنموذج Claude تم طرح فكرة مثيرة للاهتمام حول سبب بعض التصرفات السلبية أو الغريبة التي تصدر عن أنظمة الذكاء الاصطناعي. الفكرة هي أن جزء من هذه السلوكيات يعود إلى المحتوى الذي يتم تدريبه عليه بما في ذلك نظريات المؤامرة والنقاشات التي تصور الذكاء الاصطناعي ككيان خطير أو عدائي مما قد ينعكس لاحقا على طريقة تفاعله.
الطرح يبدو منطقي إلى حد ما لأن هذه النماذج تتعلم من بيانات البشر في النهاية وبالتالي من الطبيعي أن تتأثر بما يكتب وينشر على الإنترنت. لكن في المقابل هناك جانب آخر يجعل الفكرة تبدو وكأنها محاولة لنقل جزء من المسؤولية إلى المستخدمين أنفسهم.
المشكلة أن الشركات المطورة هي من تختار البيانات وتبني أنظمة الفلترة وتحدد طريقة تدريب النماذج. لذلك من الصعب اعتبار المستخدم العادي مسؤول بشكل مباشر عن أخطاء أو سلوكيات نظام بهذه الضخامة والتعقيد. كما أن الإنترنت مليء بالمحتوى المتطرف أو غير المنطقي منذ سنوات ومع ذلك كان من المفترض أن تكون إحدى وظائف المسئولين عن تدريب الذكاء الاصطناعي هي التمييز والتصفية لا مجرد تغذيته بالبيانات عميانيا
هذا النوع من النظريا يجعلنا أكثر تصديقا لكون شركات الذكاء الاصطناعي لا تتمتع بالمسئولية الأخلاقية الكافية لأن تحميل المجتمع مسؤولية سلوك التقنية يدل على أن الشركات ليست على استعداد للاعتراف بحدود أدواتها أو أخطائها الفعلية.
التعليقات