تحدثتُ في مساهمةٍ سابقةٍ عن النماذج اللغوية الكبيرة LLMs وأثرها على صناعة البرمجيات، وسأعرّفكم اليوم على مفهوم رديف ومعزز لهذه التقنية وهو التوليد المعزز بالاسترداد Retrieval-Augmented Generation أو ما يعرف اختصارًا RAG ودوره في تحسين نتائج النماذج اللغوية الكبيرة.
يعني هذا المصطلح تزويد النموذج اللغوي بقاعدة معرفة موثوقة يعتمد عليها إضافة لبيانات التدريب الخاصة بالنموذج قبل أن نطلب منه أن يولد لنا النتائج والردود.
فالنماذج اللغوية الكبيرة تدَّرب عادةً على كميات هائلة من البيانات لتتمكن من القيام بمهامها المذهلة كالإجابة على أسئلتنا والترجمة من لغة لأخرى بجودة عالية، لكنها تدَّرب عادةً على بياناتٍ عامة وليس على بيانات مخصصة بمجال محدد يهمنا.
فماذا لو كنت أريد إجابات على بيانات مخصصة، كأن أكون شركة قانونية وأريد تخصيص النموذج ليولّد إجاباتٍ من القانون السعودي مثلاً، أو تدريبه على الأحاديث النبوية وجعله يتحقق لي من صحة أي حديثٍ نبوي ويخبرني عن سنده ودرجة صحته، أو غير ذلك من البيانات المخصصة بدون الحاجة إلى إعادة تدريب النموذج.
هنا يبرز دور هذه التقنية التي توفر لنا طريقة فعالة لتحسين مخرجات نماذج اللغة الكبيرة وجعلها مناسبةً للعديد من المجالات والتخصصات الدقيقة بدلاً من تركها تعمل في سياقٍ عام قد لا يوفر لنا الفائدة التي نرجوها أو تقدم أي معلوماتٍ عشوائية عندما لا تعثر على الإجابة.
علي سبيل المثال، استفسارات العملاء يمكن أن تكون صياغتها غامضة أو معقدة أو تتطلب معرفةً لا يمتلكها النموذج، أو لا يمكنه تحليلها بسهولة، في هذه الحالة يختلق نموذج LLM الإجابات ويكون أشبه بموظف مبتدئ متحمس للغاية، والذي يتسرع في تقديم إجابةٍ قبل التحقق من الحقائق.
وكمثال مأخوذ من الحياة الواقعية، إذا أرادت موظفة معرفة عدد أيام إجازة الأمومة التي يحق لها الحصول عليها، هنا يستجيب برنامج الدردشة الآلي الذي لا يستخدم RAG ببساطة: "خذي الوقت الذي تريدينه"، لكن في الحقيقة تعتبر إجراءات إجازة الأمومة معقدة نسبيًا، لأنها تختلف حسب البلد أو الولاية التي تقع فيها الشركة، فبينما فشلت LLM في العثور على إجابة دقيقة، كان ينبغي عليها أن تجيب: "أنا آسف لا أعرف"، أو أن تطرح أسئلة إضافية حتى تتمكن من الوصول إلى سؤال يمكنها الإجابة عليه بشكل نهائي، بينما ستقوم RAG بطرح عدة أسئلة على الموظفة بخصوص البلد والولاية التي تقيم فيها وكذلك عدد مرات الولادات السابقة وفيما إذا حصلت على إجازات أمومة حينها، وغيرها من الأسئلة كي تتمكن أن تجيبها بدقةٍ تامة، وهنا يكمن الفرق بين التقنيتين. لذا ما هي المجالات والتخصصات الأخرى التي ترون أن تقنية RAG تفيد فيها في مجال عملكم أو هواياتكم أو المؤسسات التي تعملون بها؟
التعليقات