在python3.3里面,用urllib.request代替urllib2,另外python3之后,不能再用,print html
注意:print 的東西要用()括起來。
這樣的方式,因為print這個時候已經是一個方法了。必須使用下面的方法
可以將代碼換成:
import urllib.request
resp=urllib.request.urlopen('http://www.baidu.com')
html=resp.read()
print(html)
注意:print 的東西要用()括起來。
這樣的方式,因為print這個時候已經是一個方法了。必須使用下面的方法
可以將代碼換成:
import urllib.request
resp=urllib.request.urlopen('http://www.baidu.com')
html=resp.read()
print(html)
2019-01-03
最新回答 / 慕粉3535685
你這個url_manager.py里面的has_new_url()方法,返回的東西寫錯了。不是返回len(self.add_new_urls) != 0是返回
len(self.new_urls)?!=?0
2019-01-02
已采納回答 / mumu1233
find_all返回的結果是一個結果集,要用in去遍歷里面的單個元素,直接操作這個結果集會報錯,而find返回的是單個元素,你可以直接使用這個單個元素
2018-12-30
這個是針對py2版本的...所以朋友們要看,建議看python3的版本的...否則這個學完你會一臉懵逼的懷疑人生,我靠...
2018-12-30
老師講的很清晰,思路明確。跟著老師敲了一遍,經過兩天的摸索差不多才明白。
下面是我跟著老師寫的代碼,python3.7+bd4+urlib3環境下能運行:https://github.com/xinwang296/webspider2.git
下面是我跟著老師寫的代碼,python3.7+bd4+urlib3環境下能運行:https://github.com/xinwang296/webspider2.git