ما هي بوتفول سوب واهميتها والية عملها
كل ما عرفته من المواقع الاجنبية هي انها مكتبة لسحب البيانات من HTML وXML
scraping عموماً هو عملية استخراج البيانات من المواقع أي تحليل ملفات HTML وما شابهها.
ما ذكرته هي مكتبة للغة Python تقوم بعملية تحليل ملفات التي تعتمد في هيكلتها على الـDOM واستخراج البيانات منها.
هذا المثال من مقع المكتبة يقوم باستخراج جميع الروابط من أي موقع:
from bs4 import BeautifulSoup
import requests
url = raw_input("Enter a website to extract the URL's from: ")
r = requests.get("
http:/ " +url)
data = r.text
soup = BeautifulSoup(data)
for link in soup.find_all('a'):
print(link.get('href'))
/www.pythonforbeginners.com/python-on-the-web/web-scraping-with-beautifulsoup/
التعليقات