سيكون الموضوع طويلاً بعض الشيء، لكن أرجو أن تتمعنوا جيدًا لما سيقال هنا !!!!!، حيث أراها فرصة محتملة وفكرة واعدة.
منذ عدة أشهر قد طرحت سؤالاً هنا في منصة حسوب عن مقارنة الذكاء الصناعي الخبير Rule-based والذكاء الصناعي القائم على تعلم الآلة Machine Learning، بل وبحثت في مصادر مختلفة عن هذا الموضوع، لكن لا توجد مقارنة حقيقية، واتضح لي أن هذا منطقي كون النظام الخبير يكون مصممًا لأداء مهمة لها مدخلات ضمن نطاق ثابت، مثلاً تطبيقات تشخيص الحالة المرضية بناءً على الأعراض، والتي يتم اختيارها من خلال خيارات محددة مسبقًا، وكذلك خدمة الرد الآلي، بينما نماذج التعلم الآلي صُممت لمهام ذات مدخلات متغيرة كنماذج المحادثة الديناميكية مثل ChatGPT. السبب وراء بحثي عن مقارنة في ذلك الوقت هو عدم اقتناعي بالتوجه الحالي للذكاء الصناعي.
نماذج التعلم الآلي باختصار
كيف يتم تدريب نماذج الذكاء الصناعي التي تستخدم تعلم الآلة؟: باختصار، يتم إعطاء النماذج اللغوية الكبيرة LLM مجموعة كبيرة من البيانات، وتحلل نمط العلاقات بين الكلمات، بحيث تحدد أهمية كلمة ما بناءً على الكلمات الأخرى المتواجدة في القطعة النصية وارتباطها بهم، ثم يتم تخزينها كمتجه Vector، وثم عند إعطاء قطعة نصية جديدة للنموذج، يقوم بتوقع كل كلمة ويحلل ناتج توقعه، ومع التدريب المستمر تصبح نتائج التوقعات إيجابية، وبذلك يكون قد حدد النمط المحتمل.
كيف تعالج رسائل المستخدم؟: باستخدام ما يسمى بالشبكة العصبية، حيث تتكون من طبقات متعددة، الطبقة الوسطى تسمى الطبقة المخفية Hidden Layer، وهي التي تعمل على معالجة البيانات واستخلاص الأنماط منها، ولا تكون تفاصيلها ظاهرة، وقد تتكون من عدة طبقات فرعية، ثم تنتقل النتائج إلى الطبقة النهائية لإخراج الردود المناسبة.
ما سلبيات كل ما سبق لجعلي غير مقتنع بالتوجه الحالي؟:
- الاعتماد الكبير على كميات هائلة من البيانات يجعل هذه النماذج عرضة للتحيز Bias إذا كانت البيانات نفسها تحتوي على تحيزات أو أخطاء، وهذا يعني أن النتائج قد تكون غير عادلة أو غير دقيقة في بعض الحالات، خصوصًا أن أغلبها من الإنترنت، حيث يكثر المحتوى غير الدقيق علميًا، والقديم الذي لم يتم تحديثه.. إلخ.
- غياب الفهم الحقيقي، فالنموذج لا يفهم المعنى بطريقة فعلية، بل هي بالنسبة له "تخمينات أو توقعات أو احتمالات"، حيث تكون نواتجه صادرة من عمليات إحصائية في الطبقات المخفية، وبالتالي لا يمكننا فهم ما الأسس التي بُنيت عليها إجابات النموذج. الرسم البياني التالي يوضح مشكلة ذلك: [https://runestone.academy/n...]. هذا الرسم لتمثيل متوسط درجة الحرارة في أيام شهر معين، تُظهر القيم المتطرفة أحداثًا استثنائية قد تُهملها النماذج الإحصائية، مما يعكس ضعف تعاملها مع الحالات غير النمطية، ونلاحظ أن هناك قيم تم تجاهلها في هذا النظام الإحصائي، بالرغم من أهمية التخلص من القيم البعيدة Extreme Values في بعض الحالات، إلا أن هناك حالات تستوجب دراستها، وتجاهلها قد يؤثر بالسلب، وهذا ما يحدث بالضبط مع النماذج الحالية، حيث تتعامل جيدًا مع الحالات التي لها نمط مشابه لما تعلمته، لكنها قد تبدأ غالبًا بإعطاء نتائج غير دقيقة مع حالات مختلفة تمامًا عما تعلمته.
- التكلفة في كل شيء، حيث إن توليد كلمة واحدة فقط من الرد أو الاستجابة عملية تحتاج إلى معالجة كبيرة، فكيف بتوليد الرد كاملاً؟!!!، كما يتعامل مع عدد كبير بشكل غير معقول من المعلمات لا تقل عن مئات الآلاف وربما الملايين والتي لم أفهم لما كل ذلك بالرغم من بساطة كثير من الحالات، وعليه، يتوجب وجود قدر كبير جدًا من الموارد والعتاد التقني الذي لا يمكن إلا للشركات الكبيرة توفيره، وهذا سبب عدم توافر تلك الخدمات غالبًا للاستخدام المحلي، بل تتوافر فقط كخدمات سحابية، وبالتالي تكون عملية تدريب تلك النماذج واستدامتها مكلفة بشكل لا يصدق.
- الشركات التي توفر تلك النماذج تقوم بجمع البيانات من المستخدمين، قد يكون ذلك من أجل تدريب النماذج عليها، لكن لا توجد ضمانات مؤكدة فيما يتعلق بطريقة تصرف تلك الشركات في البيانات المجمعة من المستخدم، وهذه مشكلة مرتبطة أكثر بمن ليس له الوعي الكافي، وأغلب المستخدمين كذلك.
- المشاكل البيئية وغيرها مما لا يمكن ذكره.
نموذج ذكاء صناعي قائم بالكامل على القواعد فقط، بشكل نظري:
قبل عدة أشهر وقبل طرحي للسؤال هنا على حسوب، كنت قد بدأت بعمل بحث للهيكلة النظرية للنموذج، بالرغم أن فكرة الذكاء الصناعي بالقواعد Rule-based ليست بالفكرة الجديدة، إلا أن توظيفه للعمل بديناميكية مثل النماذج الحالية بالقواعد فقط أمر مختلف تمامًا وصعب بعض الشيء، لكن هذا أمر طبيعي، فكل المواضيع غير المألوفة تكون هكذا دومًا، كما أنه يستحق المحاولة و يمثل بديلاً يستحق الاستكشاف.
على غرار استخدام الأساليب الإحصائية المعقدة والمحاكاة المتكلفة لعقل الإنسان بواسطة الشبكات العصبية الصناعية كما في النماذج الحالية، بدأت في محاولة فهم كيف يتم تمثيل كل شيء حولنا وكيفية فهمنا له، وترجمة كل ذلك إلى خطوات منطقية يمكن تطبيقها في البيئة الحاسوبية بما يناسب حدودها دون تكلف، الأمر أشبه بمقارنة بين فنانين: الأول (النماذج الحالية) هاوٍ يحمل حقيبة ضخمة مليئة بمئات الأدوات - ألوان، فرش، ومعدات معقدة - لكنه مثقل بكمية الأدوات التي نادرًا ما يستخدمها، ويضيع وقتًا في البحث عن الأداة المناسبة ليحاول تقليد لوحة معينة مع تغيير طفيف في التفاصيل، بينما الثاني (نموذجنا النظري) محترف لا يحمل سوى بضعة أقلام وورقة صغيرة، لكنه بمهارته وتركيزه يبدع تحفة فنية أصيلة بأقل الموارد، مع القدرة على التعديل بسرعة إذا احتاج الأمر.
المزايا النظرية للنموذج:
- إمكانية تشغيله على الأجهزة الشخصية محليًا، والاتصال بالإنترنت عند الحاجة فقط كمتابعة خبر معين أو البحث عن تحديثات لموضوع معين، مما يقلل من الاعتماد على الخدمات السحابية ويجعل النموذج متاحًا للأفراد دون الحاجة إلى بنية تحتية ضخمة.
- يتم معالجة البيانات الضرورية فقط، عكس النماذج الحالية التي تستهلك كميات هائلة من البيانات بشكل عشوائي تقريبًا، مما يجعل النظام أكثر كفاءة ويقلل من استهلاك الموارد بشكل كبير، حيث يتم التركيز على المعلومات ذات الصلة بدلاً من تحليل كل شيء دون تمييز.
- عدم الانحيازية والدقة والموثوقية، لأن النموذج يعتمد على قواعد منطقية محددة مسبقًا وموثقة، مما يضمن نتائج متسقة ويمكن التحقق منها بسهولة، خاصة في التطبيقات التي تتطلب دقة عالية كالتشخيص الطبي أو اتخاذ القرارات القانونية.
- الوضوح والشفافية والمنطقية، حيث يمكن للمستخدم أو المطور فهم كل خطوة في عملية اتخاذ القرار داخل النموذج، على عكس "الصندوق الأسود" في الشبكات العصبية، مما يجعله أكثر جدارة بالثقة وسهولة في التعديل أو التصحيح عند الحاجة.
- إمكانية تشغيله على الأجهزة الشخصية مع استهلاك منخفض للطاقة، لأن النموذج لا يعتمد على معالجة بيانات ضخمة أو ملايين المعلمات، بل على قواعد محددة ومباشرة يمكن تنفيذها بكفاءة حتى على أجهزة ذات موارد محدودة، مما يجعله صديقًا للبيئة ومتاحًا للجميع.
- التكيف مع الحالات الاستثنائية، حيث يمكن تحديث القواعد يدويًا أو تلقائيًا بناءً على الحاجة لتغطية القيم المتطرفة أو السيناريوهات غير المتوقعة، دون الحاجة إلى إعادة تدريب النموذج بالكامل على بيانات جديدة، مما يعطيه مرونة عملية مع الحفاظ على بساطته.
قد قمت ايضا بالبدء ببحث في جزئية اخرى قبل فترة لآلية تعلم الالة لكن بواسطة القواعد فقط، حيث ان عملية التعلم عملية موجهة بطبعها
لا يزال هناك الكثير ليكتمل البحث النظري و بعض المواضيع التي تحتاج الى فهم اوسع، لكني اعتقد انني قد وصلت الى مرحلة لا بأس بها حتى الان كأساس و اثبات للفكرة
في النهاية، أتطلع لسماع آرائكم و مدى اهتمامكم بالموضوع، حيث انوي مشاركة ما قد توصلت اليه حتى الان من اجل اكمال البحث مع من يهمه الامر و له الرغبة في المشاركة او مجرد الاطلاع و المناقشة
____________________________________________________________________________
مصادر مفيدة ستساعد في فهم بعض الافكار في نماذج الذكاء الصناعي الحالية بالتعلم الالي: