السلام عليكم ورحمة الله تعالى و بركاته

الكل يعلم بموقع ويب ارشيف الذي يحتوي على عدد ضخم من الصفحات المحفوظة منذ الازل ، لكل هل يوجد منكم من سأل كيف يعمل الموقع ؟؟ ببساطة و على عجالة من أمري D:

  • يعمل الموقع بتقنية WebCrawler و حفظ الصفحات و تستخدمها برامج ( فحص المواقع في اكتشاف الثغرات )

https://ar.wikipedia.org/wiki/زاحف_الشبكة

  • مؤسسة The Wayback Machine التي بدأت في حفظ الصفحات منذ سنة 1996 دون ان نعلم ذلك و قد تم عمل تحديث لها لتشمل جميع المواقع الجديدة و اعتمدت على عدة مواقع مثل ( أليكسا Alexa )

  • يصل معدل التخزين في موقع الأرشيف 100 تيرابايت

  • يقوم الارشيف بحفظ الصفحات الديناميكية صفحات HTML + الجافاسكربت و بالاضافة الى بعض الملفات الامتدادية و المرفقات احيانا RAR + ZIP

  • يتعطل احيانا حفظ الصفحات بعدد من الاسباب منها حسب ما تم ذكره لديهم :

http://pastebin.com/UqTS1pAX

للمزيد من المعلومات : https://goo.gl/vvRREU