久久久高清一区二区三区,久久一伊人亚洲二区

首頁免費課 Python開發簡單爬蟲問答

Python開發簡單爬蟲

全部評論問答未解決精華

報錯---SyntaxError: invalid syntax，實在無奈，找了幾天還沒找出原因

已采納回答 / 這個名字七個字

我的html_downloader代碼頭部加的是下面這個，沒報錯import urllib.request

4 回答 12833 瀏覽 7-2 調度程序

2016-12-02

用python2.7打完了之后運行失敗

已采納回答 / OMG快到碗里來

大兄弟你的源碼能讓我看看嗎我的出不來結果先謝謝你了

2 回答 1061 瀏覽

2016-12-01

python 3.5 解析器代碼問題

最新回答 / 豬豬的笨笨

感覺你是最近才學的吧。如果是，建議你學習一下基礎，然后一個一個模塊的學習使用。最后再一次使用多個模塊。而且，這個視頻的python和模塊有點老，你要小心有很多坑，我就是被坑了很多次?。?！

12 回答 2507 瀏覽 7-5 HTML解析器html_parser

2016-12-01

只輸出craw1 后面就craw failed

+ 我來回答回答最高可+2積分

6 回答 1435 瀏覽 7-7 開始運行爬蟲和爬取結果展示

2016-11-28

import urllib2 為什么報錯啊

已采納回答 / YYIN

如果你用的是python3的話，要把import urllib2寫成import urllib.request

3 回答 1375 瀏覽 5-3 Python爬蟲urlib2實例代碼演示

2016-11-24

引入BeautifulSoup冒紅線，但是我已經成功安裝過BeautifulSoup4了

最贊回答 / pinro

應該是from bs4 import BeautifulSoup吧

8 回答 2807 瀏覽 6-4 BeautifulSoup實例測試

2016-11-24

小白求解python3.5報錯

已采納回答 / qq_Chandler_34038455

而且你最后link.get_text()是點，不是逗號，望采納

4 回答 982 瀏覽 6-4 BeautifulSoup實例測試

2016-11-21

UserWarning: You provided Unicode markup but also provided a value for from_encoding. Your from_encoding will be ignored.

已采納回答 / LUXIN66

python3 缺省的編碼是unicode, 再在from_encoding設置為utf8, 會被忽視掉，代碼是從python2轉來的，去掉就可以了

2 回答 5286 瀏覽 6-4 BeautifulSoup實例測試

2016-11-19

urllib2中的request.add_data()的作用

已采納回答 / 慕粉3962690

www.baidu.com? ?只是首頁你要用他干什么呢比如你要用它搜索 python 他的鏈接請求就會變成 www.baidu.com?wd=python? (這只是給你簡單解釋下真實的鏈接比較復雜做了很多處理) 自己搜下看下地址欄就知道了，簡單來說就根據不同的請求參數可以讓我抓取不同的頁面和內容。ps:去了解HTTP協議的get請求和post請求。

3 回答 4417 瀏覽 5-2 Python爬蟲urlib2下載器網頁的三種方法

2016-11-11

求這個爬蟲完整的源碼

已采納回答 / Spider_Maker4260916

http://pan.baidu.com/s/1i4Ag6n7

3 回答 1225 瀏覽 7-7 開始運行爬蟲和爬取結果展示

2016-11-11

BeautifulSoup的參數問題

已采納回答 / 千里馬123

前面是要解析的內容，后面的'html.parser'是指定解析器的意思。因為beautiful有不止一種解析器可以去解析內容。

1 回答 2331 瀏覽 7-5 HTML解析器html_parser

2016-11-05

link['href']，變量后加['href']是什么意思

已采納回答 / 重明子

link是一個字典，link["herf"]就是找到“herf”的鍵值

3 回答 3422 瀏覽 7-5 HTML解析器html_parser

2016-11-02

爬不到1000個。。。

最新回答 / qq_江仔_0

def _get_new_urls(self, curr_url, soup): ? ?new_urls = set() ? ?links = soup.find_all('a', href=re.compile(r"/item/*"))正則表達式的內容改下就行，網頁格式變了

7 回答 1012 瀏覽 8-1 課程總結

2016-10-24

結果為什么只輸出一行

+ 我來回答回答最高可+2積分

10 回答 1339 瀏覽 7-5 HTML解析器html_parser

2016-10-23

if _name_ == "_main_"

已采納回答 / 龍蝦_V

if __name__=="__main__"

2 回答 1760 瀏覽 7-2 調度程序

2016-10-19

首頁上一頁 7 8 9 10 11 12 13 下一頁尾頁

該課程已下架

課程須知: 本課程是Python語言開發的高級課程 1、Python編程語法； 2、HTML語言基礎知識； 3、正則表達式基礎知識；

老師告訴你能學到什么？: 1、爬蟲技術的含義和存在價值 2、爬蟲技術架構 3、組成爬蟲的關鍵模塊：URL管理器、HTML下載器和HTML解析器 4、實戰抓取百度百科1000個詞條頁面數據的抓取策略設定、實戰代碼編寫、爬蟲實例運行 5、一套極簡的可擴展爬蟲代碼，修改本代碼，你就能抓取任何互聯網網頁！

微信掃碼，參與3人拼團

熱搜

最近搜索清空

Python開發簡單爬蟲