اخواني اخواتي سلام الله عليكم جميعا
رمضانكم كريم
اريد ان اعرف ما هي نراحل برمجة و بناء ذكاء اصطناعي و هل هناك كورس تقترحونه لي لمعرفة كل ما يخص مجال بناء و تطوير ذكاء اصطناعي
مشكورين و جزاكم الله خيرا
أولاً يجب عليك تحديد المشكلة التي يهدف النموذج لحلها، سواء كان ذلك التنبؤ بالبيانات، التصنيف، أو غيرها.
بعد ذلك تحتاج للكثير من البيانات المناسبة للتدريب. يتم جمع هذه البيانات من مصادر مختلفة وتنظيفها وتهيئتها للاستخدام في التدريب. مع اختيار النموذج الأنسب للمشكلة المحددة.
بعدها يتم تدريب النموذج باستخدام البيانات التي تم جمعها في مرحلة الجمع، حيث يتم ضبط معلمات النموذج لتقديم أفضل أداء ممكن.
هذه المراحل بشكل مختصر ويمكنك الإطلاع على المزيد من التفاصيل من خلال الرابط التالي حيث يحتوي على الكثير من المقالات الخاصة بالذكاء الإصطناعي
وبالنسبة للدورات العليمية فيوجد الكثير من المصادر سواء باللغة العربية مثل دورة الموجود بأكاديمية حسوب
أو الكثير من المصادر ابللغة الإنجليزية على مواقع مثل coursera وغيره
هناك الكثير من المراحل التي تدخل في عملية بناء الذكاء الاصطناعي، أداة منه، أولاً يبدأ الأمر بتحديد المشكلة والحصول على البيانات اللازمة عنها، وتركز هذه المرحلة الأولية على فهم المهمة أو المشكلة المحددة التي تريد أن يحلها الذكاء الاصطناعي، بمجرّد ما يتمّ هذا الفهم بشكل واضح يمكن البدء في اختيار النموذج المناسب للعمل، حيث هناك العديد من أساليب الذكاء الاصطناعي المختلفة، مثل التعلم الآلي أو التعلم العميق الـ deep learning أو الذكاء الاصطناعي الرمزي..إلخ
ليتم بعدها تدريب نموذج الذكاء الاصطناعي على العملر وعملية التحسين المستمر.
هذا الكلام السابق كل تفصيلة منه يدخل فيها الكثير من التفصيلات الأخرى ومراحل البناء، ولتأخذ فكرة شاملة عن أفضل المحتويات على الإطلاق ضمن هذا الباب، إما أن تأخذ باللغة العربية كورس حسوب على أكاديمية حسوب وهو بعنوان : الذكاء الاصطناعي أو أن تأخذ كورس الذكاء الاصطناعي باللغة الإنكليزية على منصّة udacity.
هل تقصد بناء نموذج ذكاء اصطناعي من الصفر؟ سأحاول توضيح الأمر بشكل مُختصر جدًا.
بدايًة الأمر ليس بتلك السهولة بالطبع، فتكلفة تدريب النموذج على البيانات ضخمة جدًا، لذا ستجد أنه يتم استخدام نماذج جاهزة في الدورات.
حيث تتطلب عملية تدريب نموذج لغة كبير موارد حاسوبية كبيرة، مما يكلف حوالي 150 ألف دولار لنموذج 10 مليارات بارامتر و 1.5 مليون دولار لنموذج 100 مليار بارامتر، حيث تحتاج إلى آلاف من وحدات معالجة الرسومات (GPUs) وتكلف ملايين الدولارات، ويستغرق وقت التدريب أسابيع أو شهورًا أو سنوات.
ويبدأ الأمر بجمع البيانات، فذلك هو الجزء الأكثر أهمية ويستغرق وقتًا طويلاً من العملية، فتتطلب نماذج اللغة الكبيرة كميات هائلة من بيانات التدريب، بحجم تريليونات الكلمات، ويجب أن تكون تلك البيانات عالية الجودة وذات صلة بالمهمة التي سيتم استخدام النموذج فيها.
و يتم تحديد بنية النموذج، وهناك بنى مختلفة لـ نماذج LLMs، لكن الأكثر شيوعًا هي المحولات Transformers، فهي عبارة عن شبكات عصبية قادرة على تعلم العلاقات بين الكلمات في تسلسل.
فبعد تحديد البيانات التي سيتم تدريب النموذج عليها، تأتي مرحلة تنقية البيانات وهي الخطوة الأهم والأكثر استهلاكًا للوقت، بسبب أنها:
وبالتأكيد يوجد تقنيات تدريب المختلفة، لكن ليس موضع ذكرها هنا.
ثم تأتي خطوة تقييم النموذج، ويعد التقييم البشري أكثر الطرق موثوقية ولكنه يتطلب جهدًا كبيرًا، وبالإمكان استخدام مقاييس معالجة اللغة الطبيعية مثل التعقيد ومعدل BLEU للتقييم الكمي، أو استخدام النماذج المُحسنة الموجودة بالفعل لتقييم جودة مخرجات نموذج اللغة الكبير.
التعليقات