已解決430363個問題，去搜搜看，總會有你想問的

為什么我不能用漂亮的湯刮？

首頁猿問為什么我不能用漂亮的湯刮？

為什么我不能用漂亮的湯刮？

Python

素胚勾勒不出你 2022-06-02 16:23:49

我需要從這個網站上刮下唯一的桌子：https ://core.ap.gov.in/CMDashBoard/UserInterface/eAgriculture/eAgricultureVillagewise.aspx?mandal=Agali&district=Anantapuramu我用了漂亮的湯和請求，但沒有成功。你們能建議我哪里出錯了嗎？mandal_url = "https://core.ap.gov.in/CMDashBoard/UserInterface/eAgriculture/eAgricultureVillagewise.aspx?mandal=Agali&district=Anantapuramu"r = requests.get(mandal_url, verify=False).contentsoup = bs4.BeautifulSoup(r, 'lxml')df = pd.read_html(str(soup.find('table',{"id":"gvAgricultureVillage"})))我在數據框中看到“找不到頁面”。我不知道我哪里錯了！

查看完整描述

3 回答

慕少森

TA貢獻2019條經驗獲得超9個贊

該頁面可能需要某種登錄。通過單擊鏈接自己查看它，我得到

您需要將 cookie / 其他一些標頭添加到請求中以顯示“已登錄”。

反對回復 2022-06-02

眼眸繁星

TA貢獻1873條經驗獲得超9個贊

嘗試單擊您嘗試從無效鏈接中抓取的鏈接。當我單擊您提供的鏈接或您存儲的鏈接時mandal_url，都返回“找不到頁面”頁面。因此，您以正確的方式進行抓取，但是您提供給抓取工具的 url無效/不再可用。

反對回復 2022-06-02

ABOUTYOU

TA貢獻1812條經驗獲得超5個贊

我無法訪問該網站。但是您可以通過以下方式直接閱讀網頁上的表格：

dfs = pd.read_html(your_url, header=0)

如果 url 需要身份驗證，您可以通過以下方式獲取表單：

r = requests.get(url_need_authentivation, auth=('myuser', 'mypasswd'))
pd.read_html(r.text, header=0)[1]

這將簡化您的代碼。希望能幫助到你！

反對回復 2022-06-02

3 回答
0 關注
167 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

為什么我不能用漂亮的湯刮？

為什么我不能用漂亮的湯刮？

3 回答

添加回答

為什么我不能用漂亮的湯刮？

為什么我不能用漂亮的湯刮？