1 回答

TA貢獻1827條經驗 獲得超8個贊
狀態代碼429表示連接過多。下載器上的請求計數為 1,因為 429 表示拒絕并且不會通過下載器。他們錯誤地向他們認為是機器人的任何請求提供 429 代碼。
經過實驗后,由于缺少 cookie 標頭,它拒絕了我,該 cookie 標頭是在 set-cookie 標頭的初始 GET 請求中設置的。這里有一些嘗試將 Selenium 作為任何抓取項目中的最后一個選項。
嘗試使用像下面這樣的完整標題和COOKIES_ENABLED = True.
Host: www.realestate.com.au
User-Agent: Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:77.0) Gecko/20100101 Firefox/77.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
Accept-Language: en-US,en;q=0.5
Accept-Encoding: gzip, deflate, br
Referer: https://duckduckgo.com/
Connection: keep-alive
Upgrade-Insecure-Requests: 1
Pragma: no-cache
Cache-Control: no-cache
TE: Trailers
添加回答
舉報