ما هو تعلم الآلة؟

صاغ آرثر صموئيل ، وهو رائد في مجال الذكاء الاصطناعي وألعاب الكمبيوتر ، مصطلح "التعلم الآلي". عرّف التعلم الآلي بأنه "مجال الدراسة الذي يمنح أجهزة الكمبيوتر القدرة على التعلم دون برمجة مبرمجة".

بطريقة عادية جدًا ، يمكن شرح "التعلم الآلي" على أنه أتمتة وتحسين عملية تعلم أجهزة الكمبيوتر استنادًا إلى تجاربها دون أن تتم برمجتها فعليًا ، دون أي مساعدة بشرية. تبدأ العملية بتغذية بيانات جيدة ومن ثم تدريب أجهزتنا (أجهزة الكمبيوتر) من خلال بناء نماذج تعلم الآلة باستخدام البيانات والخوارزميات المختلفة. يعتمد اختيار الخوارزميات على نوع البيانات التي لدينا ونوع المهمة التي نحاول تنفيذها تلقائيًا.

مثال: تدريب الطلاب أثناء الامتحان.

أثناء التحضير للامتحانات ، لا يصمم الطلاب الموضوع بالفعل بل يحاولون تعلمه بفهم تام. قبل الامتحان ، يقومون بإطعام الجهاز (المخ) بكمية جيدة من البيانات عالية الجودة (أسئلة وأجوبة من كتب مختلفة أو ملاحظات المعلمين أو محاضرات الفيديو عبر الإنترنت). في الواقع ، إنهم يقومون بتدريب عقولهم على المدخلات وكذلك المخرجات ، أي نوع من النهج أو المنطق لديهم لحل نوع مختلف من الأسئلة. في كل مرة يقومون بحل أوراق اختبار الممارسة والعثور على الأداء (الدقة / النتيجة) من خلال مقارنة الإجابات مع مفتاح الإجابة المعطى ، تدريجيا ، يستمر الأداء في الزيادة ، واكتساب المزيد من الثقة مع النهج المعتمد. هذه هي الطريقة التي يتم بها بناء النماذج فعليًا ، وتدريب الآلة مع البيانات (يتم إعطاء كل من المدخلات والمخرجات للنموذج) ، وعندما يحين الوقت لاختبار البيانات (مع المدخلات فقط) وتحقيق درجات النموذج لدينا من خلال مقارنة إجابتها مع الإخراج الفعلي الذي لم تم تغذيتها أثناء التدريب. يعمل الباحثون بجهد حثيث لتحسين الخوارزميات والتقنيات بحيث تؤدي هذه النماذج أداء أفضل بكثير

الفرق الأساسي في ML والبرمجة التقليدية؟

البرمجة التقليدية: نحن نتغذى على البيانات (الإدخال) + البرنامج (المنطق) ، ونشغلها على الجهاز ونحصل على المخرجات.

تعلم الآلة: نتغذى في البيانات (المدخلات) + المخرجات ، ونشغلها على الجهاز أثناء التدريب وتقوم الآلة بإنشاء برنامجها الخاص (المنطق) ، والذي يمكن تقييمه أثناء الاختبار.

ماذا يعني بالضبط التعلم لجهاز الكمبيوتر؟

يقال إن الكمبيوتر يتعلم من التجارب فيما يتعلق بفئة من المهام ، إذا كان أدائه في مهمة معينة يتحسن مع التجربة.

بشكل عام ، يمكن تعيين أي مشكلة في التعلم الآلي لأحد تصنيفين عريضين:

التعلم تحت الإشراف والتعلم غير الخاضع للإشراف.

كيف تعمل الأشياء في الواقع: -

عند الحديث عن التسوق عبر الإنترنت ، يوجد ملايين من المستخدمين لديهم مجموعة غير محدودة من الاهتمامات فيما يتعلق بالعلامات التجارية والألوان والنطاق السعري وغيرها الكثير. أثناء التسوق عبر الإنترنت ، يميل المشترون إلى البحث عن عدد من المنتجات. الآن ، فإن البحث عن منتج ما بشكل متكرر سيجعل Facebook أو صفحات الويب أو محرك البحث الخاص بالمشتري أو المتجر الذي يبدأ على الإنترنت يوصي أو يعرض العروض على هذا المنتج بعينه. لا يوجد أحد يجلس هناك لترميز هذه المهمة لكل مستخدم ، كل هذه المهمة تلقائية بالكامل. هنا ، التعلم الالي يلعب دوره. يقوم الباحثون وعلماء البيانات ومتعلمو الآلات ببناء نماذج على الجهاز باستخدام نوعية جيدة وكمية هائلة من البيانات ، والآن يعمل أجهزتهم تلقائيًا ويحسن مع زيادة الوقت والمزيد من الخبرة والوقت.

تقليديا ، تم الإعلان فقط باستخدام الصحف والمجلات والراديو ، ولكن التكنولوجيا الآن قد جعلتنا أذكياء بما فيه الكفاية للقيام بالإعلانات المستهدفة (نظام الإعلانات عبر الإنترنت) والتي هي وسيلة أكثر كفاءة لاستهداف الجمهور الأكثر تقبلا.

حتى في مجال الرعاية الصحية أيضًا ، يقوم ML بعمل رائع. أعد الباحثون والعلماء نماذج لتدريب آلات للكشف عن السرطان فقط من خلال النظر إلى صور الخلايا المنزلق. بالنسبة للبشر لأداء هذه المهمة ، فقد استغرق الأمر الكثير من الوقت. ولكن الآن ، لا مزيد من التأخير ، تتنبأ الآلات بفرص الإصابة أو عدم إصابتها بسرطان بدرجة من الدقة ويتعين على الأطباء فقط إجراء مكالمة ضمان ، هذا كل شيء. الإجابة على - كيف يكون هذا ممكنًا بسيطًا جدًا - كل ما هو مطلوب ، هو ، آلة حساب عالية ، وكمية كبيرة من بيانات الصور عالية الجودة ، ونموذج ML مع خوارزميات جيدة لتحقيق نتائج متطورة.

يستخدم الأطباء ML حتى لتشخيص المرضى على أساس معايير مختلفة قيد النظر.

ربما تكون قد استخدمت تصنيفات IMDB أو صور Google حيث تتعرف على الوجوه أو Gmail التي تصنف البريد الإلكتروني على أنه اجتماعي أو ترويجي أو تحديثات أو منتدى باستخدام تصنيف النص ، وهو جزء من ML.

كيف يعمل التعلم الالي؟

  • جمع البيانات السابقة بأي شكل مناسب للمعالجة. كلما كانت جودة البيانات أفضل ، كلما كان ذلك مناسبًا للنمذجة.

-معالجة البيانات - في بعض الأحيان ، تكون البيانات التي تم جمعها في شكل أولي ويجب معالجتها مسبقًا.

مثال: قد تحتوي بعض المجموعات على قيم مفقودة لسمات معينة ، وفي هذه الحالة ، يجب ملؤها بقيم مناسبة من أجل إجراء التعلم الآلي أو أي شكل من أشكال استخراج البيانات.

قد يتم استبدال القيم المفقودة للسمات العددية مثل سعر المنزل بالقيمة المتوسطة للسمة ، بينما يمكن استبدال القيم المفقودة للسمات الفئوية بالسمة ذات الوضع الأعلى. هذا يعتمد دائمًا على أنواع الفلاتر التي نستخدمها. إذا كانت البيانات في شكل نص أو صور ، فسيلزم تحويلها إلى شكل رقمي ، سواء كانت قائمة أو مصفوفة أو مصفوفة. ببساطة ، يجب أن تكون البيانات ملائمة ومتسقة. يتم تحويله إلى تنسيق يمكن فهمه بواسطة الجهاز

  • قسّم بيانات الإدخال إلى مجموعات تدريب واختبار. يجب أن تكون النسبة بين المجموعتين 6: 2: 2

  • بناء نماذج مع خوارزميات وتقنيات مناسبة في مجموعة التدريب.

  • اختبار نموذجنا المفاهيمي بالبيانات التي لم يتم تغذية النموذج بها في وقت التدريب وتقييم أدائه باستخدام مقاييس مثل درجة F1 والدقة والتذكر.

المتطلبات الأساسية لتعلم الالي:

الجبر الخطي

الإحصاءات والاحتمالات

حساب التفاضل والتكامل

نظرية الرسم البياني

مهارات البرمجة - لغة مثل Python أو R أو MATLAB أو C ++ أو Octave

تصنيف التعلم الآلي

يتم تصنيف تطبيقات التعلم الآلي في ثلاث فئات رئيسية ، اعتمادًا على طبيعة "إشارة" التعلم أو "استجابة" المتاحة لنظام التعلم والتي هي على النحو التالي: -

-التعلم الخاضع للإشراف: عندما تتعلم الخوارزمية من خلال أمثلة البيانات والردود المستهدفة المرتبطة التي يمكن أن تتكون من قيم رقمية أو تسميات سلسلة ، مثل الفئات أو العلامات ، من أجل التنبؤ لاحقًا بالاستجابة الصحيحة عند طرحها بأمثلة جديدة ، فإنها تندرج تحت فئة التعلم المشرف . هذا النهج يشبه بالفعل التعلم البشري تحت إشراف المعلم. يقدم المعلم أمثلة جيدة للطالب ليحفظها ، ثم يستمد الطالب القواعد العامة من هذه الأمثلة المحددة.

-التعلم غير الخاضع للإشراف: عندما تتعلم الخوارزمية من أمثلة واضحة دون أي استجابة مرتبطة ، تترك الخوارزمية لتحديد أنماط البيانات من تلقاء نفسها. يميل هذا النوع من الخوارزمية إلى إعادة هيكلة البيانات إلى شيء آخر ، مثل الميزات الجديدة التي قد تمثل فئة أو سلسلة جديدة من القيم غير المرتبطة. إنها مفيدة جدًا في تزويد البشر برؤى ثاقبة لمعنى البيانات والمدخلات المفيدة الجديدة لخوارزميات التعلم الآلي الخاضعة للإشراف.

كنوع من التعلم ، فهو يشبه الطرق التي يستخدمها البشر لمعرفة أن بعض الكائنات أو الأحداث هي من نفس الفصل ، مثل ملاحظة درجة التشابه بين الأشياء. تعتمد بعض أنظمة التوصيات التي تجدها على الويب في شكل أتمتة التسويق على هذا النوع من التعلم.

-تعزيز التعلم : عندما تقدم الخوارزمية مع أمثلة تفتقر إلى التصنيفات ، كما هو الحال في التعلم غير الخاضع للإشراف. ومع ذلك ، يمكنك أن تصاحب مثالًا بردود فعل إيجابية أو سلبية وفقًا للحل الذي تقترحه الخوارزمية التي تندرج تحت فئة تعلم التعزيز ، وهي متصلة بالتطبيقات التي يجب أن تتخذ الخوارزمية قرارات بشأنها (بحيث يكون المنتج إلزاميًا ، وليس مجرد وصفي ، كما هو الحال في التعلم غير الخاضع للرقابة) ، والقرارات تحمل عواقب. في العالم البشري ، يشبه التعلم بالتجربة والخطأ.

تساعدك الأخطاء على التعلم نظرًا لوجود عقوبة إضافية (التكلفة ، وفقدان الوقت ، والندم ، والألم ، وما إلى ذلك) ، مما يعلمك أن احتمال نجاح مسار معين قد يكون أكثر من الآخرين. مثال شيق على تعلم التعزيز يحدث عندما تتعلم أجهزة الكمبيوتر تشغيل ألعاب الفيديو بمفردها.

في هذه الحالة ، يقدم التطبيق الخوارزمية مع أمثلة لمواقف معينة ، مثل جعل اللاعب عالقًا في متاهة مع تجنب عدو. يتيح التطبيق للخوارزمية معرفة نتائج الإجراءات التي يتخذها ، ويحدث التعلم أثناء محاولة تجنب ما يكتشف أنه خطير ومتابعة البقاء. يمكنك إلقاء نظرة على كيفية قيام شركة Google DeepMind بإنشاء برنامج تعليمي معزّز يلعب ألعاب فيديو Atari القديمة. عند مشاهدة الفيديو ، لاحظ كيف يكون البرنامج في البداية غير متقن وغير ماهر ولكن يتحسن بثبات مع التدريب حتى يصبح بطلاً.

البيانات:

يمكن أن تكون أي حقيقة أو قيمة أو نص أو صوت أو صورة غير معالج لا يتم تفسيرها وتحليلها. البيانات هي الجزء الأكثر أهمية في جميع تحليلات البيانات والتعلم الآلي والذكاء الاصطناعي. بدون بيانات ، لا يمكننا تدريب أي طراز وستذهب كل الأبحاث والأتمتة الحديثة دون جدوى. الشركات الكبيرة تنفق الكثير من الأموال فقط لجمع أكبر قدر ممكن من البيانات.

على سبيل المثال: لماذا حصل Facebook على WhatsApp بدفع ثمن باهظ قدره 19 مليار دولار؟

الجواب بسيط ومنطقي للغاية - إنه الوصول إلى معلومات المستخدمين التي قد لا يتوفر عليها فيسبوك ولكن سيكون لدى WhatsApp. تعد هذه المعلومات الخاصة بمستخدميها ذات أهمية قصوى لـ Facebook حيث إنها ستسهل مهمة التحسين في خدماتهم.

المعلومات:

البيانات التي تم تفسيرها والتلاعب بها والآن بعض الاستدلال ذات مغزى بالنسبة للمستخدمين.

المعرفة:

مزيج من المعلومات المستخلصة والخبرات والتعلم والرؤى. النتائج في الوعي أو بناء المفهوم لفرد أو منظمة.