python版本3.7.0在使用urllib爬蟲獲取網頁html代碼時,編碼時報錯,忽略掉錯誤。html = data.decode(charset,errors='ignore')得到的html只有上半部分。而網頁本應該已</html>結尾的。就是說丟失了一部分。請問各位大神這是什么情況?網上都搜不到結果。難道就我一個人遇到嗎?話說python寫爬蟲確實快,但我剛開始都踩了好幾個坑了。
python3用urllib爬網頁,為什么得到的html只有上半部分?
浮云間
2018-07-11 17:13:36