التعرف على الوجوه هو أسلوب للتعرف على الوجوه المستخدمة للأفراد الذين تم حفظ صورهم في قاعدة البيانات. على الرغم من أن الطرق الأخرى لتحديد الهوية يمكن أن تكون أكثر دقة، فإن التعرف على الوجوه ظل دائمًا محورًا مهمًا للبحث بسبب طبيعته غير المتدخلة ولأنه طريقة سهلة في التعرف على الأشخاص.
طرق التعرف على الوجه: -
هناك طرق مختلفة للتعرف على الوجوه، وهي كما يلي: -
أساس هندسي / قالب: خوارزميات التعرف على الوجوه تصنف على أنها خوارزميات قائمة على الخوارزميات الأساسية. يمكن بناء الطرق المعتمدة على القوالب باستخدام أدوات إحصائية مثل SVM [آلات دعم المتجهات] أو PCA [تحليل المكونات الرئيسية] أو LDA [تحليل التمييز الخطي] أو طرق Kernel أو تحويلات التتبع. تقوم الأساليب القائمة على الميزة الهندسية على تحليل ميزات الوجه المحلية وعلاقتها الهندسية. ومن المعروف أيضا باسم الأسلوب القائم على الميزة.
مجزأة / كلي: العلاقة بين العناصر أو الوظائف المتصلة مع الوجه كله، اتبع العديد من الباحثين هذا النهج، في محاولة لاستنتاج الخصائص الأكثر صلة. حاولت بعض الطرق استخدام العيون ومجموعة من الميزات وما إلى ذلك. تندرج بعض أساليب نموذج إخفاء ماركوف في هذه الفئة، وتعتبر من أشهر الطرق في التعرف على الوجوه.
القائم على المظهر / القائم على النموذج: الطريقة المستندة إلى المظهر تُظهر وجهاً يتعلق بعدة صور. الصورة تعتبر متجهًا عالي الأبعاد. عادة ما تستخدم هذه التقنية لاشتقاق المساحة الميزة من قسم الصورة. يتم مقارنة صورة العينة بمجموعة من النسخ. من ناحية أخرى، فإن النهج القائم على النموذج يحاول تشكيل الوجه. العينة الجديدة المطبقة على النموذج ومعلمات النموذج المستخدم للتعرف على الصورة. يمكن أن تعتمد الطريقة المستندة إلى المظهر على أنها خطية أو غير خطية. PCA، LDA، IDA المستخدمة في النهج الخطى في حين أن Kernel PCA المستخدمة في النهج غير الخطية. من ناحية أخرى، في الطريقة القائمة على النموذج، يمكن تصنيفها على أنها مطابقة ثنائية الأبعاد أو ثلاثية الأبعاد تستخدم مطابقة الرسم البياني.
قالب / الإحصائية / الشبكات العصبية القائمة:
مطابقة النموذج: - في القالب الذي يتطابق مع الأنماط، يتم تمثيل النماذج بواسطة نموذج أو نماذج أو وحدات بكسل أو مواد، إلخ. تكون وظيفة التعرف عادةً ارتباط أو قياس مسافة.
المنهج الإحصائي: - في النهج الإحصائي، يتم التعبير عن الأنماط كسمات. وظيفة التعرف هي التمييز بين الاختلافات. كل صورة ممثلة فيما يتعلق بالميزات. لذلك، فإن الهدف من ذلك هو اختيار وتطبيق الأداة الإحصائية الصحيحة للاستخراج والتحليل. هناك العديد من الأدوات الإحصائية، والتي تستخدم للتعرف على الوجوه. هذه الأدوات التحليلية المستخدمة في مجموعتين أو أكثر أو طرق التصنيف.
هذه الأدوات هي كما يلي-
• تحليل المكون الرئيسي [PCA]: - يعد تحليل المكون الرئيسي أحد أكثر الطرق الإحصائية المستخدمة والمذكورة. يؤدي الإجراء الرياضي إلى تقليل لأبعاد عن طريق استخراج المكون الرئيسي للبيانات متعددة الأبعاد.
• تحويل جيب التمام المنفصل [DCT]: - يدل على سلسلة من نقاط البيانات المتعلقة بمجموع وظائف جيب التمام ترددات مختلفة تتأرجح. يعتمد تحويل جيب التمام المنفصل على تحويل فورييه المنفصل، وبالتالي عن طريق ضغط الاختلافات يمكن استخدامه لتحويل الصور والسماح بتخفيض أبعاد فعال.
• تحليل خطي التمييز [LDA]: - يستخدم LDA على نطاق واسع للعثور على مزيج خطي من الميزات مع الحفاظ على فصل الفصل. على عكس PCA، يحاول LDA أن يصمم على أساس الفرق بين المستويات. لكل مستوى يحصل LDA تختلف في ناقلات الإسقاط متعددة.
• المحافظة على التوقعات [LPP]: - قدم HE وNIYOGI ال LPP. هذا هو أفضل بديل ل PCA للحفاظ على بنية الموقع والتصميم. عادة ما تبحث خوارزميات التعرف على الأنماط عن أقرب نقش أو أثر. لذلك يمكن المحافظة على جودة LLP وتسريع الاعتراف. • موجات غابور: - في هذا الخوارزمية، يشير هذا إلى أن دليل البيانات الفسيولوجية العصبية من القشرة البصرية لأدمغة الثدييات يوحي بأن الخلايا البسيطة في القشرة المرئية يمكن أن تُرى على أنها عائلة من موجات غابور ثنائية الأبعاد المتشابهة ذاتيًا. وظائف Gabor التي اقترحها Daugman هي مرشحات النطاق المكاني المحلية التي تحقق الحد النظري للقرار الموحد للمعلومات في المجالين المكاني 2D وFourier.
• تحليل المكونات المستقلة [ICA]: - يهدف ICA إلى تحويل البيانات كمجموعات خطية لنقطة البيانات المستقلة إحصائياً. لذلك فإن هدفها هو توفير صورة مستقلة غير مرتبطة بدلاً من ذلك. يعد ICA بديلاً عن PCA، والذي يوفر تمثيل بيانات أكثر قوة. إنه معيار تحليل تمييزي، والذي يمكن استخدامه لتعزيز PCA. • نواة PCA: - سكولكوف وآخرون. عرض استخدام وظائف Kernel لأداء PCA غير الخطي. منهجيتها الأساسية هي تطبيق مناظرة غير خطية على المدخلات ومن ثم حل PCA خطي في فضاء الميزة الناتجة. 3. الشبكات العصبية: - واصلت الشبكة العصبية استخدام التعرف على الأنماط وتصنيفها. كان Kohonen أول من أظهر أنه يمكن استخدام شبكة الخلايا العصبية للتعرف على الوجوه المحاذية والمطابقة. هناك طرق، والتي تؤدي استخراج ميزة باستخدام الشبكات العصبية. هناك العديد من الطرق، والتي تم دمجها مع أدوات مثل PCA أو LCA وجعل مصنف هجين للتعرف على الوجوه. هذه هي مثل شبكة التغذية الأمامية العصبية مع وجود انحياز إضافي، والخرائط ذاتية التنظيم مع PCA، والشبكات العصبية التلافيفية مع إدراك متعدد الطبقات، وما إلى ذلك. يمكن أن تزيد من كفاءة النماذج.
• الشبكات العصبية مع مرشحات غابور: - تحقق الخوارزمية التعرف على الوجوه عن طريق تطبيق مدرك متعدد الطبقات باستخدام خوارزمية الانتشار الخلفي. أولاً، هناك خطوة ما قبل المعالجة. كل صورة طبيعية في مراحل التباين والإضاءة. ثم تتم معالجة كل صورة من خلال مرشح Gabor. يحتوي مرشح Gabor على خمسة معاملات متجه وثلاثة ترددات مكانية، لذلك هناك 15 طول موجي Gabor.
• الشبكات العصبية ونماذج ماركوف المخفية: - نماذج Markov المخفية هي أداة إحصائية تستخدم في التعرف على الوجوه. لقد استخدموا مع الشبكات العصبية. تم إنشاؤه في شبكة عصبية تدرب الزائفة 2D HMM. إن مدخلات عملية HMM ثنائية الأبعاد هذه هي مخرجات ANN، وهي توفر الخوارزمية مع تقليل الأبعاد المناسبة. • الشبكات العصبية المشوشة: - قدمت الشبكات العصبية الغامضة للتعرف على الوجوه في عام 2009. في هذا النظام التعرف على الوجوه باستخدام الإدراك الحسي متعدد الطبقات. المفهوم الكامن وراء هذا النهج هو التقاط الأسطح في المشعبات غير الخطية، وهي مهمة لا يكاد يكملها MLP. يتم الحصول على متجهات الميزة باستخدام تحويلات طول الموجة Gabor.
كيف يعمل التعرف على الوجوه: -
هناك العديد من الطرق للتعرف على الوجوه. هنا نستخدم OpenCV للتعرف على الوجوه. في التعرف على الوجوه، تم إعداد الصورة لأول مرة للمعالجة المسبقة ثم تدريب جهاز التعرف على الوجوه على التعرف على الوجوه. بعد تدريس أداة التعرف، نقوم باختبار أداة التعرف على النتائج. جهاز التعرف على الوجوه OpenCV من ثلاثة أنواع، وهي كالتالي: 1. EigenFaces تواجه EigenFaces وجهات نظر أداة التعرف في جميع الصور التدريبية لجميع الشخصيات كمجمع ومحاولة لاستنتاج المكونات. هذه المكونات ضرورية ومفيدة (الأجزاء التي تستحوذ على معظم التباين / التغيير) وتتجاهل بقية الصور، وبهذه الطريقة لا تقوم فقط باستخراج العناصر الأساسية من بيانات التدريب ولكنها توفر أيضًا الذاكرة عن طريق رفض الأجزاء الأقل أهمية. 2. FisherFaces خوارزمية واجهات Fisherfaces، بدلاً من الحصول على ميزات مفيدة تمثل جميع وجوه جميع الأشخاص، فإنها تزيل الميزات القيمة التي تميز شخصًا عن الآخرين. لا تسيطر ميزات شخص واحد على الآخرين، ولديك ميزات تميز شخصًا عن الآخرين. 3. الأنماط الثنائية المحلية نحن نعلم أن Eigenfaces وFisherfaces تتأثر كل من الضوء وفي الحياة الحقيقية لا يمكننا ضمان ظروف الإضاءة المثالية. LBPH التعرف على الوجوه هو تحسين للتغلب على هذا العيب. الفكرة ليست في العثور على الميزات المحلية للصورة. تحاول خوارزمية LBPH العثور على البنية المحلية للصورة، وتقوم بذلك من خلال مقارنة كل بكسل مع وحدات البكسل المجاورة.
نص المقال الأصلي باللغة الانجليزية :
التعليقات