في الأيام الماضية ناقشنا جوجل ومحركات البحث حسناً لم لانعمل على خورازمية لفهرسة المواقع العربية (أنظر للأمر كأنه تمرين ذهني)، ليس بالضرورة أن ندخل في تفاصيل لغة البرمجة أو غيرها دعونا نبني خورازمية بنظام ال pseudo code ولتكن نقطة البدأ شبيهة بمحرك جوجل في بدايته.

1- تغذية المحرك بمجموعة من الروابط

2- فتح جميع المواقع وإستخراج أي روابط فيها

3- حفظ الروابط في قاعدة البيانات ومن ثم يتم تكرار الخطوة من 1 إلى 3 على الروابط الجديدة.

حسنا كيف سنقيس ترابط كلمة البحث مع مانبحث عنه؟ مقدار تكرار الكلمة في الصفحة؟ أم أن الأمر بحاجة إلى فهم الصفحة كاملة ومعالجتها لغوياً؟