ربما قد سمع الكثير بمصطلح "تعلم الآله" ، لكن معظم الناس لا يفهمون تمامًا معنى هذه الكلمات. تعلم الآله ليس صيغة واحدة يتم تطبيقها ببساطه على مشكلة ما. هناك العديد من الخوارزميات للاختيار من بينها ، يمكن استخدام كل منها لتحقيق أهداف مختلفة..

ما هو تعلم الآلة؟

قبل أن نذهب بعيدا ونتعمق ، دعونا نحدد بالضبط ما هو تعلم الآلة؟ تعلم الآلة يدور حول بناء برامج ، ذات باراميترات يتم ضبطها تلقائيا بناءا على البيانات التي تمت مشاهدتها سابقًا ، البرامج قادرة على تحسين وتطوير سلوكها , البرامج يمكن أن تؤدي وظيفتها على مجموعة بيانات لم تراها من قبل .

هل يذكرك هذا التعريف بالذكاء الاصطناعي ؟ هذا صحيح تعلم الآله هو في الواقع فرع من فروع الذكاء الاصطناعي. يمكن اعتبار خوارزميات تعلم الآله بمثابة اللبنة الأساسية التي تساعد أجهزة الكمبيوتر على تعلم القيام بالعمل بذكاء أكبر.

هناك نوعان من خوارزميات تعلم الآله :

(تعلم خاضع للإشراف) و (غير خاضع للإشراف) تستخدم الخوارزميات الخاضعة للإشراف المدخلات (أو المخرجات المتوقعة) كبيانات تدريب لانشاء النموذج، بينما تستخدم الخوارزميات غير الخاضعة للإشراف مدخلات فقط. تستخدم الخوارزميات غير الخاضعة للاشراف عملية تسمى التجميع , يجمع البرنامج البيانات المتشابهة إلى مجموعات و ثم يقوم بتصنيف بيانات الاختبار بناء على قربها أو بعدها من هذه المجموعات. يتضمن ذلك إنشاء مجموعات فرعية داخل البيانات.

كمثال ،

تخيل أنك تقوم بتدريس طفل للتعرف على أنواع مختلفة من الخضروات. في التعلم الخاضع للإشراف نقوم بتقديم الخضار للطفل وذكر اسمائها وقول "هذه جزرة. هذه بازلاء . هذا بروكلي. " و يتضمن التعلم غير الخاضع للاشراف تقديم الخضروات دون ذكر أسمائها ، وجعل الطفل يصنف الخضروات : الجزرة برتقالية اللون ، والبازلاء والقرنبيط خضراء اللون. بعد ذلك يقوم الطفل بتمييز فرعي بين الخضروات الخضراء . البازلاء خضراء وصغيرة ، والبروكلي أخضر وكبير.

شجرة القرار :

هي من اقدم الخوارزميات لا يتم استخدامها على نطاق واسع اليوم ، لكنها لا تزال مهمة كأساس لتعلم الخوارزميات الأكثر تقدما

شجرة القرار هي نموذج تنبؤي خاضع للإشراف. يمكن أن يتعلم التنبؤ بالمخرجات من خلال الإجابة على الأسئلة بناءً على قيم المدخلات التي يتلقاها.

وهي من الأساليب المعروفة والمشهورة في علم البيانات ويتم استخدامها في عمليات التنبؤ prediction والتصنيف classification.

تستخدم أشجار القرار سمات مختلفة "خصائص" لتقسيم البيانات بشكل متكرر إلى مجموعات فرعية حتى تصبح المجموعات الفرعية نقية ، مما يعني أنها تشترك جميعها في نفس القيمة المستهدفة.

لقياس نقاء مجموعة فرعية

في شجرة القرار ، يمكن استخدام أي سمة لتقسيم البيانات ، على الرغم من أن الخوارزمية تختار السمة والحالة استنادًا إلى نقاء المجموعات الفرعية الناتجة, (يتم تحديد درجة نقاء مجموعة فرعية بالتأكد من القيم المستهدفة ضمن مجموعة فرعية).

تمتلك أشجار القرار عددًا من المزايا والعيوب التي يجب مراعاتها عند تحديد ما إذا كانت مناسبة لاستخدامها في حاله معينة

تشمل المزايا ما يلي:

1-يمكن استخدامها للانحدار أو التصنيف

2-يمكن عرضها بيانيا

3-قدرة تفسير عالية

4-اقرب لعملية صنع القرار البشري من خوارزميات تعلم الآله ""ML الأخرى

5- تنبؤ سريع

6-لا تحتاج الخصائص إلى توسيع

7-يتعلم تلقائيا تفاعلات الخاصية

8- يميل إلى تجاهل الميزات التي ليس لها صلة

تشمل عيوب أشجار القرار ما يلي:

1-لا يتنافس اداءها بشكل عام مع أفضل طرق التعلم الخاضعة للإشراف

2-يمكن أن تؤدي الاختلافات الصغيرة في البيانات إلى شجرة مختلفة تمامًا

3-يتخذ التقسيم الثنائي التكراري قرارات قد لا تؤدي إلى شجرة مثالية على مستوى العالم

4-لا تميل إلى العمل بشكل جيد مع التصنيفات الغير متوازنة للغاية

5-لا تميل إلى العمل بشكل جيد مع مجموعات البيانات الصغيرة جدًا

المقالة الاصل