2 回答

TA貢獻1772條經驗 獲得超6個贊
您只需要一個簡單的請求即可獲取 json 格式的所有信息:
import requests
headers = {
'sec-fetch-mode': 'cors',
'dnt': '1',
'pragma': 'no-cache',
'accept-encoding': 'gzip, deflate, br',
'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_0) AppleWebKit/537.36 (KHTML, like Gecko) '
'Chrome/77.0.3865.120 Safari/537.36',
'accept': 'application/json, text/plain, */*',
'cache-control': 'no-cache',
'authority': 'www.nemlig.com',
'referer': 'https://www.nemlig.com/',
'sec-fetch-site': 'same-origin',
}
response = requests.get('https://www.nemlig.com/webapi/v2/Delivery/GetDeliveryDays?days=8', headers=headers)
json_data = response.json()
例如,您可以將days=參數更改為 20 并獲取 20 天的數據。

TA貢獻1786條經驗 獲得超11個贊
Selenium 不適用于網頁抓取。
嘗試查找nemlig.com 的內部 api。無需等待 JS 處理,而是找到返回所需數據的 http 端點。您可以使用瀏覽器中的開發人員工具或一些工具(例如 Burp Suite)來完成此操作。
之后,只需使用 requests/urllib 收獲它。
https://ianlondon.github.io/blog/web-scraping-discovering-hidden-apis/