Python爬蟲是什么?
1 回答

暮色呼如
TA貢獻1853條經驗 獲得超9個贊
網絡爬蟲是一個自動提取網頁的程序,它為搜索引擎從萬維網上下載網頁,是搜索引擎的重要組成。傳統爬蟲從一個或若干初始網頁的URL開始,獲得初始網頁上的URL,在抓取網頁的過程中,不斷從當前頁面上抽取新的URL放入隊列,直到滿足系統的一定停止條件。為什么用Python寫爬蟲呢,是因為Python跨平臺,對Linux和windows都有不錯的支持;科學計算,數值擬合:Numpy,Scipy;可視化:2d:Matplotlib(做圖很漂亮), 3d: Mayavi2 ,主要是相較于C、C++這樣的語言來說,Python最簡潔,那當然啦,爬取網頁采集數據信息時,一定要有大量的IP資源的支持呀,芝、麻HTTP還挺不錯的,IP資源豐富,還有去重,這就相當于一個好的助理,處理起工作來也事半功倍啊,嘻嘻。
添加回答
舉報
0/150
提交
取消