中文AV在线电影一区二区三区 ,在线无码一区二区三区观

首頁免費課 Python開發簡單爬蟲問答

Python開發簡單爬蟲

全部評論問答未解決精華

cookieJar[]內容為空，且三種方式求得長度不相同，得到的html 是亂碼，求大神解答?。?！

最新回答 / 白小白123

這個是亂碼顯示的是二進制的一個形式用這個decode()解碼

1 回答 545 瀏覽 5-3 Python爬蟲urlib2實例代碼演示

2019-01-17

含有中文的url不能download，

最贊回答 / 永恒的小白

<...圖片...>這一步務必使用函數進行url的拼接,帶有中文的url會有編碼問題

3 回答 1993 瀏覽 7-7 開始運行爬蟲和爬取結果展示

2019-01-12

我try except報一個錯之后就跳出來了，為什么不回繼續執行while循環的呢？

最新回答 / 癡情1

因為URL集合空了，應該是正則表達式寫的不太行。

3 回答 2392 瀏覽 7-2 調度程序

2019-01-11

跪求鏈接啊

最贊回答 / 慕絲3084285

老師用的eclipse，也可以用pycharm，我覺得pycharm方便些

1 回答 778 瀏覽 1-1 Python開發簡單爬蟲課程介紹

2019-01-07

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 140: i llegal multibyte sequence

最新回答 / YAAnnnnnnnnn

這是編碼錯誤，gbk編碼不能夠輸出為正確的編碼格式。原因是win8的python3的默認編碼不是utf8，我們只需要將默認編碼改為utf8就能解決這個問題，參見下面的代碼：?

import?sys,?io
sys.stdout?=?io.TextIOWrapper(sys.stdout.buffer,encoding='utf8')?#?Change?default?encoding?to?utf8

1 回答 1180 瀏覽 7-7 開始運行爬蟲和爬取結果展示

2019-01-05

TypeError: object of type 'method' has no len()

最新回答 / 慕粉3535685

你這個url_manager.py里面的has_new_url()方法，返回的東西寫錯了。不是返回len(self.add_new_urls) != 0是返回

len(self.new_urls)?!=?0

1 回答 3894 瀏覽 7-3 URL管理器

2019-01-02

正則表達式去匹配的時候，發現不能用find_all，只能用find呢，這是正常的嗎？

已采納回答 / mumu1233

find_all返回的結果是一個結果集，要用in去遍歷里面的單個元素，直接操作這個結果集會報錯，而find返回的是單個元素，你可以直接使用這個單個元素

2 回答 1429 瀏覽 6-4 BeautifulSoup實例測試

2018-12-30

https 是不能爬取的嗎

+ 我來回答回答最高可+2積分

1 回答 1664 瀏覽 7-2 調度程序

2018-12-29

這個是怎么回事？我是怎樣執行的 python spider_main.py

最新回答 / supbad

好像導入模塊失敗了？是不是你沒有做 Mark Directory as? source? 這個操作所以它找不到你的模塊？

1 回答 1250 瀏覽

2018-12-28

只爬取了兩頁就正常結束了去掉try模塊也沒有報錯

最贊回答 / 慕工程1066870

把import urllib 換成import? urllib.request 試試

4 回答 979 瀏覽 7-7 開始運行爬蟲和爬取結果展示

2018-12-27

爬取頁面里面有注釋，想獲取注釋里面的內容

最新回答 / 慕妹4169226

具體是什么樣的注釋呢？能描述的詳細一點嗎。

1 回答 1676 瀏覽 8-1 課程總結

2018-12-26

爬出來的是亂碼

+ 我來回答回答最高可+2積分

1 回答 953 瀏覽 7-4 HTML下載器html_downloader

2018-12-25

怎么在這個基礎上爬取百度新聞記錄

+ 我來回答回答最高可+2積分

0 回答 907 瀏覽 7-5 HTML解析器html_parser

2018-12-20

為什么都是這個結果，哪里出問題了？求大神指點?。?/i>

最新回答 / 慕的地042143
<...圖片...>應該是utf-8

6 回答 1204 瀏覽 8-1 課程總結
2018-12-15

只輸出了兩條內容，但去掉try并沒有報錯。。。要哭了，請各位大神幫忙看看！

+ 我來回答回答最高可+2積分

0 回答 490 瀏覽
2018-12-12

首頁上一頁 8 9 10 11 12 13 14 下一頁尾頁

該課程已下架

課程須知

本課程是Python語言開發的高級課程 1、Python編程語法； 2、HTML語言基礎知識； 3、正則表達式基礎知識；

老師告訴你能學到什么？

1、爬蟲技術的含義和存在價值 2、爬蟲技術架構 3、組成爬蟲的關鍵模塊：URL管理器、HTML下載器和HTML解析器 4、實戰抓取百度百科1000個詞條頁面數據的抓取策略設定、實戰代碼編寫、爬蟲實例運行 5、一套極簡的可擴展爬蟲代碼，修改本代碼，你就能抓取任何互聯網網頁！

微信掃碼，參與3人拼團

你發的評論可能會是問題？
是否將他發到問答中

熱搜

最近搜索清空

Python開發簡單爬蟲