亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

Python 請求錯誤 400 瀏覽器發送了無效請求

Python 請求錯誤 400 瀏覽器發送了無效請求

小怪獸愛吃肉 2022-10-06 16:56:12
我在網絡爬蟲/抓取方面的知識非常有限,并且正在嘗試為此創建一個網絡爬蟲URL。但是,當我嘗試從服務器通常打印響應文本時,我得到了這個:<html><body><h1>400 Bad request</h1>Your browser sent an invalid request.</body></html>我認為代碼沒有任何問題,因為它可以在我嘗試過的其他網站上運行。希望這里的好人能幫我解決這個問題。這只是一種預感,但這是否是由 url 不以 a 結尾引起的.xml?import requestsurl = 'https://phys.org/rss-feed/'res = requests.get(url)print(res.text[:500])
查看完整描述

1 回答

?
慕村9548890

TA貢獻1884條經驗 獲得超4個贊

嘗試使用BeautifulSoup和標頭來掩蓋您的請求,就像一個真實的請求一樣:


import requests,lxml

from bs4 import BeautifulSoup

URL='https://phys.org/rss-feed/'

USER_AGENT = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10.14; rv:65.0) Gecko/20100101 Firefox/65.0"

headers = {"user-agent": USER_AGENT}

resp = requests.get(URL, headers=headers)

soup = BeautifulSoup(resp.content, "lxml")

print(soup)

僅屏蔽也有效:


import requests

URL='https://phys.org/rss-feed/'

USER_AGENT = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10.14; rv:65.0) Gecko/20100101 Firefox/65.0"

headers = {"user-agent": USER_AGENT}

resp = requests.get(URL, headers=headers)


查看完整回答
反對 回復 2022-10-06
  • 1 回答
  • 0 關注
  • 82 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號