صورة من الدراسة: الفرق بين الأفكار الفعلية، والأفكار التي تم فك تشفيرها باستخدام نموذج الذكاء الاصطناعي اللغوي الكبير GPT.

في أول مايو، نُشرت دراسة في مجلة Nature لعلوم الأعصاب أحدثت ضجة كبيرة، ونقاشا واسعا. نجح الباحثون في قراءة أفكار المشتركين في الدراسة من صور الرنين المغناطيسي الوظيفي (fMRI) فقط، وبدقة مذهلة تتجاوز 80%. سأحاول تلخيص ما توصلوا إليه، ورابط البحث في آخر المساهمة لمن يحب الاطلاع عليه.

منهج البحث

استخدم الباحثون تقنية الرنين المغناطيسي الوظيفي (fMRI) لجمع سجلات النشاط الدماغي من ثلاثة أفراد أثناء استماعهم لحلقات من مدونات صوتية (Podcasts). ثم، قام الفريق بتحليل هذه السجلات باستخدام نموذج الذكاء الاصطناعي GPT لتحديد الكلمات التي فّكر فيها الشخص بناء على النشاط الدماغي في صور الرنين.

قام الفريق بتخصيص النموذج اللغوي GPT وتدريبه على مجموعة ضخمة من البيانات المجمعة من موقع ريديت (Reddit)، و240 قصة من (The Moth Radio Hour)، ومدونات صوتية (Podcasts). ونجحوا في إنشاء أداة قوية تتمكن من فك تشفير الأفكار بشكل مستمر.

ملخص النتائج

استطاع النموذج اللغوي إنشاء وصف كلامي مفهوم للأفكار من خلال الكلام المسموع، والكلام المتخيل، وحتى الفيديوهات الصامتة بدقة جيدة:

  • الكلام المسموع (يستمع الأفراد إلى تسجيل صوتي): 72-82%.
  • الكلام المتخيل (يتخيل الأفراد قصة مدتها دقيقة ذهنيًا): 41-74%.
  • الأفلام الصامتة (يشاهد الأفراد مقاطع صامتة من أفلام بيكسار Pixar): 21-45% من تفسير الأفراد للفيلم.

رؤية التشابه الشديد بين الأفكار الحقيقية، والمسترجعة مثير للقلق حقا. فما رأيكم بهذه الدراسة؟ وهل تؤيدون تطوير تقنيات كهذه؟

من ضمن ما تحدث عنه الفريق البحثي هو مخاوفهم المتعلقة بالخصوصية والأمان، فكيف ترون ذلك؟

البحث المنشور