أجرى الباحثون دراسة حديثة لاختبار قدرة نماذج الذكاء الاصطناعي المتقدمة، مثل GPT-4، على أداء اختبارات تقيس الفهم الاجتماعي والنفسي. تضمنت هذه الاختبارات:
- اختبارات النوايا: تقييم قدرة النماذج على فهم نوايا الأشخاص في سيناريوهات مختلفة.
- اختبارات المعتقدات الخاطئة: التحقق من قدرة النماذج على تمييز المعتقدات الخاطئة عن الحقائق.
- اختبارات السخرية: قياس قدرة النماذج على التعرف على السخرية في النصوص.
- اختبارات القصص الغريبة: فحص كيفية تفسير النماذج للقصص التي تتضمن عناصر غير عادية أو غير متوقعة.
في الدراسة، تفوقت نماذج الذكاء الاصطناعي على البشر في اختبارات المعتقدات الخاطئة، واختبارات النوايا، واختبارات السخرية. تفوق هذه النماذج يوضح مدى تقدم الذكاء الاصطناعي في تحليل السلوك البشري، لكنه "لا يعكس فهماً حقيقياً للعواطف الإنسانية المعقدة".
كيف ترى مخاطر تزايد اعتمادنا على الذكاء الاصطناعي في مجالات تحليل البشر والمواقف وتأثير هذه النتائج على قدرات النماذج على التلاعب والتزييف؟
التعليقات