亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

                        課程
                    
                        /后端開發
                        
                            /Python
                        
                        /python遇見數據采集

為什么正確輸入代碼后運行結果是空白呢？

from urllib.request import urlopen
from bs4 import BeautifulSoup as bs
import re

resp = urlopen("https://en.wikipedia.org/wiki/Main_Page").read().decode("utf-8")
soup = bs(resp,"html.parser")
listUrls = soup.findAll("a", herf=re.compile("^/wiki/"))
for url in listUrls:
? ?print(url["herf"])

慕粉3878587

2016-09-01

源自：python遇見數據采集 3-5

關注問題我要回答

2356

操作

收起

4 回答

秋名山車神回答被采納 +3 積分
2016-09-01

最后一行?print(url["herf"])

里面的 herf 改成 href 試試看

0 回復有任何疑惑可以回復我~

#1

慕粉3878587 提問者

非常感謝！

2016-09-03 回復有任何疑惑可以回復我~

#2

慕粉3878587 提問者

老師，假如程序沒寫錯的情況下采集結果空白，怎么判斷網站反爬蟲機制起作用了呢？有沒有相關的課程學習下？

2016-09-03 回復有任何疑惑可以回復我~

秋名山車神
2016-09-03

沒有寫錯的情況下，我還沒有遇到過采集空白的問題，如果網站有防爬蟲的機制，一般都是采集了一個錯誤頁面，或者是和你使用瀏覽器看到的樣子不一樣的HTML代碼。

網站是服務器來判斷的，而服務器沒有多么的聰明，能夠區分人和爬蟲，再精密的檢查，也能夠通過程序代碼來破解，所以大部分網站防爬蟲最簡單的手段就是通過驗證碼和驗證問題，就算是百度也是這么做的。

0 回復有任何疑惑可以回復我~

慕粉3878587 提問者
2016-09-03

老師，假如程序沒寫錯的情況下采集結果空白，怎么判斷網站反爬蟲機制起作用了呢？有沒有相關的課程學習下？

0 回復有任何疑惑可以回復我~

慕粉3878587 提問者
2016-09-03

真是打錯了！汗顏，謝謝老師！

0 回復有任何疑惑可以回復我~

舉報

0/150

提交

取消

python遇見數據采集

參與學習 59663 人
解答問題 209 個

本教程讓你初步掌握Python進行數據采集，創造屬于你的價值

本課相似問答

1 回答運行結果是空

1 回答近照老師代碼，沒有結果輸出怎么辦？

1 回答resp=request.urlopen(req)這段代碼為什么要運行兩次？只運行一次為什么會出問題？

1 回答運行結果是一行為一段，沒有像pdf版本一樣，一段分為好幾行

1 回答為什么我的運行不了啊

搜索更多本課相關問答

為什么正確輸入代碼后運行結果是空白呢？

我要回答關注問題

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

掃描二維碼
關注慕課網微信公眾號