خورزمية Naïve Bayes بالتفصيل

برمجة
2018-01-24T23:35:49+00:00
المزيد
- رابط مختصر

خوازمية Naïve Bayes :

نظرية بايز هي إحدى أهم أدوات الذكاء الصناعي، والتي تدخل في تطبيقات لا تعد ولا تحصى ابتداءً من فرز رسائل البريد الإلكتروني المزعجة (Spam) وصولًا إلى مجال الكيمياء البيولوجية مرورًا بعالم الأعمال والمال والإدارة، فعلى مستوى الكيمياء البيولوجية يمكن للنظرية أن تساعد في الكشف عن الإصابة بمرض ما من خلال عينات من دم المريض، أمّا على صعيد عالم الأعمال فيمكن للنظرية أن تساعدنا في التفضيل بين عدة منتجات من عدة شركات. حتى أنّ هذه النظرية يمكن أن تستخدم في كشف الغش أثناء لعب الألعاب الإلكترونية كذلك. وعمومًا يمكنك الاطلاع على تطبيقات أكثر من خلال موقع quora.

إذا لم تتشوق إلى هذه اللحظة فلأنّنا لم نخبرك بعد بأنّ هذه النظرية لربما هي من شكلت العالم بشكله الحالي، والسبب في ذلك أنّ “آلان تورنغ” اعتمد على هذه النظرية في بناء آلته التي استطاعت فك ترميز رسائل النازيين، وهو سبب رئيسي في انتصار الحلفاء في الحرب العالمية الثانية.

حسنًا أعتقد الآن أنّك تشوقت لفهم هذه النظرية بشكل أعمق، إذًا ما عليك سوى أن تقرأ الأسطر التالية بشيء من التركيز؛ لأنّ النظرية يصعب فهمها من اللحظة الأولى.

مدخل إلى النظرية

قد يصحو أحدنا في صباحٍ ما ليجد نفسه على غير ما يرام. قد يكون أمرًا عاديًا كنزلة برد أو ما شابه، ولكن لأخذ الحيطة تقرر أن تذهب إلى الطبيب لتتأكد من ذلك. يفحصك الطبيب بشكل اعتيادي، ثمّ يطلب منك القيام ببعض الفحوصات الروتينيّة. لكن المفاجأة هي أن تكون نتيجة الفحوصات إيجابيّة لمرض عضال نادر! ونسبة صحة الاختبار هي 99%. سوف يتملّكك بالتأكيد الخوف والإحباط، ولكن السؤال الذي يطرح نفسه، هل يجب عليك القلق حقًا؟ هل من داعٍ للقلق من الأساس؟ الجواب هو “لا”! هل ازداد تفاجؤك؟ حسنًا، هذا ما سأحاول شرحه في هذا المقال.

مقدمة رياضيّة لا بدّ منها

لمتابعة المقال علينا استيعاب المعنى الرياضيّ للاحتمال، فالمقصود بالاحتمال رياضيًّا لحدثٍ ما هو قيمة عدديّة بين الصفر والواحد تعبّر عن مدى قابليّة هذا الحدث للتحقّق. أي إذا كان احتمال حدث ما هو 0 فهذا يعني أنّ الحدث مستحيل، وعلى العكس حدث ذو احتمال 1 يعني حدثًا سيقع لا محالة، وفي مثال رمي قطعة نقديّة يكون احتمال الحصول على كتابة هو 0.5 واحتمال الحصول على رسم هو أيضاُ 0.5 وهذا ما نعبّر عنه رياضيًا بالعبارة التالية: 0.5=(الحصول على كتابة)p=(الحصول على نقش)p.

بالعودة إلى مثالنا سنحتاج للمزيد من المعلومات، رأينا سابقًا أنّ احتمال الحصول على نتيجة إيجابيّة في الاختبار في حال كون المريض مصابًا بالمرض بالفعل هي 99% أو 0.99 (True positive)، ولكن الاختبار يعطي نتيجة إيجابيّة حتى لو كان المريض غير مصابًا بالمرض في 1% من الحالات (False positive)، وقد نعتقد أنّنا نملك الآن جميع المعطيات لحساب الاحتمال الحقيقي للإصابة بالمرض في حال كانت نتيجة الاختبار إيجابيّة، ولكن ينقصنا في الحقيقة احتمال الإصابة بالمرض قبل القيام بالاختبار (Prior probability)، وهذه القيمة صعبة التقدير في الحقيقة، ولكن يمكن تقريبها بنسبة الإصابة بهذا المرض في المجتمع الذي ينتمي إليه المريض، ولنفرض أنّ هذا المرض يصيب 0.1% من مجمل التعداد السكّاني في ذلك المجتمع.

ينصّ قانون بايز بما يلي:

p(H|E)=p(E|H)*p(H)/p(E)

لنحاول تفصيل العبارة السابقة. (p(H|E تعني احتمال حدوث الفرضيّة H مع العلم أنّ الحدث E قد وقع، وهذا ما يدعى بالاحتمال الشرطي، وهو في الحقيقة ما نحاول حسابه في مثالنا السابق، حيث أنّنا نحاول حساب احتمال الفرضيّة H “الشخص مصاب بالمرض” مع العلم أنّ الحدث E “نتيجة الاختبار كانت إيجابيّة” قد وقع، و (p(E|H تعني احتمال أن تكون نتيجة الاختبار إيجابيّة مع العلم أنّ المريض مصاب بالمرض وهي في الواقع نسبة صحّة الاختبار 99%. (p(H هي احتمال الإصابة بالمرض قبل القيام بالاختبار، والتي فرضنا سابقًا أنّها 0.1%. بقي لدينا الحدّ (p(E والذي يمثّل احتمال كون نتيجة الاختبار إيجابيّة، ويمكننا حسابه كما يلي:

p(E)=p(H)p(E|H)+p(-H)p(E|-H)

أي أنّه مجموع حدين هما:

احتمال أنّ يكون المريض مصابًا بالمرض ونتيجة الاختبار تأتي إيجابيّة.

احتمال أنّ يكون المريض غير مصابًا بالمرض ومع ذلك تأتي نتيجة الاختبار إيجابيّة.

يمكننا الآن تبديل الرموز السابقة بالأرقام الموافقة لنحصل على 0.09 أو 9% أي أنّ احتمال الإصابة بالمرض هو 9% فقط! وهذه القيمة صغيرة جدًا مقارنةً بنسبة صحة الاختبار 99%. إذًا كنّا محقّين بأنّه لا يجب عليك القلق!

لنشرح النتيجة

ولكن كيف لذلك أن يحدث؟ كيف يمكن لنتيجة اختبار صحيحة بنسبة 99% أن تعطينا يقينًا بالإصابة بالمرض بنسبة 9% فقط! حسنًا لنحاول النظر للأمور بالشكل التالي: لنفرض أنّنا أخذنا عينة عشوائيّة من المجتمع مكوّنة من 1000 شخص، ولنفرض أنّ جميعهم قاموا بإجراء الاختبار، فهناك بالتالي احتمال أن يكون شخص واحد فقط مصابًا بالمرض والذي سيكتشفه الاختبار بشكل صحيح، ولكن سيعطي الاختبار نتيجة إيجابيّة بنسبة 1%عند تطبيقه على الـ 999 شخص المتبقين على الرغم من كونهم سليمين تمامًا من المرض.

نظرية بايز - كيف ستغير نظرتك للعالم

أي أنّ الاختبار سيعطي نتيجة إيجابيّة خاطئة لـ 999∗%1=10 أشخاص، أي أنّ المريض الحقيقي الوحيد هو جزء من مجموعة مكونة من 11 شخص قد أعطى الاختبار نتيجة إيجابيّة لهم، وبالتالي يكون احتمال الإصابة بالمرض هو 1 من 11 أي 9% …. مذهل، أليس كذلك؟

لمحة تاريخية

ما يثير الدهشة أيضًا أنّ بايز لم يعطي اهتمامًا كبيرًا لهذه النظريّة، فلم يقم بنشرها في المجتمع العلمي ولم يشاركها مع أقرانه، ولكن تمّ اكتشافها بعد حوالي عشر سنين من وفاته، حيث طلب أحد أقربائه من صديقه القديم ريتشارد برايس (Richard Price) أن يلقي نظرة على أوراق ودفاتر بايز التي تركها بعد مماته، وعند ذلك تمّ اكتشاف أصل هذه النظريّة.

وصل بايز لهذه النظريّة بعدما قام بالتجربة التالية: جلس وراء طاولة مربّعة ومسطّحة معطيًا ظهره لها، وطلب من مساعده أن يرمي كرةً على الطاولة، بالطبع يمكن للكرة أن تستقرّ في أيّ مكان على الطاولة، وأراد بايز أن يحاول اكتشاف موقع الكرة، فكان يطلب من مساعده أن يرمي كرةً أخرى ومن ثمّ يخبره أين استقرّت الكرة الجديدة بالنسبة للكرة الأولى هكذا … باستخدام هذه الطريقة اكتشف بايز أنّ بإمكانه تخمين موقع الكرة الأولى، وكلّما ازداد عدد الكرات التي يرميها المساعد ازداد يقينه بمعرفة موقع الكرة بدقّة، ولكن بالتأكيد لن يكون متأكّدًا بنسبة 100% من موقع الكرة مهما كان عدد الكرات التي رماها مساعده، وبهذه الطريقة رأى بايز الكون. كان مؤمنًا أنّه لا يمكننا بحال من الأحوال أن نعرف حقيقة الأشياء بشكل يقينيّ برغم أنّها موجودة. كلّ ما يمكننا فعله هو تحديث تخميناتنا عنها مع كلّ تجربة نقوم بها أو دليل جديد نكتشفه. إذًا ليس هدف نظريّة بايز أنّ نستخدمها مرّة واحدة فقط، بل يجب استخدامها بشكل مستمرّ ومتكرّر لتحديث احتمال أن يكون حدثًا ما صحيحًا.

نظرية بايز لربما تغيّر فهمنا للحياة

لنعود الآن إلى مثالنا السابق، لنفرض أنّ الشخص ذهب لطبيبٍ آخر ليتأكّد بشكل أكبر من أنّه يحمل هذا المرض الخطير أم لا، فيطلب منه الطبيب القيام بالفحص مرّة أخرى ولكن هذه المرّة لدى مختبر جديد فقط ليتأكّد أنّ نتيجتي الاختبارين مستقلّتان عن بعضهما، وكما في الاختبار الأوّل نفرض أنّ نسبة صحّة الاختبار هي 99%. على فرض أنّ نتيجة الاختبار الجديد أتت إيجابيّة فما هو احتمال الإصابة بالمرض الآن؟ حسنًا، يمكننا استخدام نظريّة بايز مرّة أخرى، ولكن هذه المرّة يكون الاحتمال الأوّليّ للإصابة p(H) (Prior probability) هو 9% وليس 0.1% كما فعلنا في المرّة الأولى، حيث أنّنا قمنا من قبل بإجراء الاختبار وأتت نتيجته إيجابيّة، وعليه علينا أخذ هذه المعلومة بالحسبان.

بعد القيام بالحسابات نجد أنّ احتمال الإصابة بالمرض الآن قد ارتفع من 9% إلى 90%، وهذا منطقيّ لأنّ نتيجتين إيجابيّتين من مخبرين مختلفين من المستبعد أن تكونا خاطئتين.

إنّ ما تخبرنا به نظريّة بايز هو كيفيّة تحديث اعتقاداتنا وتصوّراتنا في ضوء الأدلّة الجديدة، ولكنّها لا تخبرنا كيف ينبغي لنا افتراض الاحتمال الأوّلّي (p(H لهذه الاعتقادات. حيث يمكن للبعض أن يكونوا مؤمنين بيقينٍ مطلق أنّ شيئًا ما صحيح أو غير صحيح، أو بعبارةٍ أخرى أنّ الاحتمال الأوّليّ (p(H هو 100% أو 0%، وفي هذه الحالة تخبرنا نظريّة بايز أنّه لا يمكن لشيءٍ على الإطلاق أنّ يغيّر رأيهم ولا يمكن لدليل مهما رأيته (أنت الذي تقف بين هاتين الحالتين المتطرّفتين) مقنعًا أن يزحزح إيمانهم!

كيفيّة تطبيق النظريّة في فرز الرسائل المزعجة

لا يوجد أحد منّا لا يعرف مدى الإزعاج الذي تسبّبه هذه الرسائل، وقد يتعدى الأمر كونها مجرّد مصدر إزعاج لتكون حيلًا لسرقة الأموال أو لاختراق والتجسس على حواسيب المستخدمين، ولكن يستطيع بريدك الإلكترونيّ في الكثير من الحالات معرفة هذه الرسائل وفرزها عن بقية الرسائل المهمّة، فكيف يتمّ ذلك؟

يمكننا أن نربط بكلّ كلمة احتمال ورود في رسالة مزعجة واحتمال ورود في الرسائل العادية. حيث أنّ بعض الكلمات توجد بشكل متكرر في الرسائل المزعجة كالإعلانات التجاريّة ورسائل الاحتيال، بينما لا تتكرر هذه الكلمات في الرسائل العاديّة. مثل: كلمة فياغرا (Viagra)، أو كلمة مبروك (Congratulation) إنّ احتمال ورود هذه الكلمات في الرسائل المزعجة أكبر بكثير من احتمال ورودها في الرسائل العاديّة. قبل تطبيق نظريّة بايز يجب تحديد الاحتمالات المذكورة سابقًا، ويتمّ ذلك عن طريق فحص عدد كبير من الرسائل وفرزها إلى رسائل مزعجة وغير مزعجة، ومن ثمّ حساب احتمال انتماء الرسالة إلى إحدى المجموعتين بناءً على مدى تكرار الكلمة في كلتا المجموعتين.

تساهم كلّ كلمة في الرسالة بإنشاء احتمال كونها بريدًا ضارًا أم لا، ويتمّ حساب هذه المساهمة عن طريق نظريّة بايز التي سبق شرحها. يتمّ حساب احتمال كون الرسالة بريدًا ضارًا بعد المرور على الكلمات جميعها، وفي حال تجاوز الاحتمال عتبةً معيّنةً ولتكن على سبيل المثال 95% يتمّ تصنيف الرسالة على أنّها spam.

في نهاية هذا المقال نكون قد قدمنا لمحة سريعة عن نظريّة بايز وبعض جوانب تأثيرها على حياتنا اليوميّة، ونتمنّى أن تكونوا استفدتم من المعلومات المقدّمة فيه.

المصادر

من مقال للأستاذ "محمد أبو محرم"

منقول عن مجموعة advanced python - arabic community :

خورزمية Naïve Bayes بالتفصيل

اقرأ أيضًا

برمجة

أطلق موقعك الإلكتروني في دقائق