簡介:本課程通過3.5小時入門Python爬蟲,完成一整套爬蟲代碼,實現抓取當當網5星圖書排行榜視頻數據,并通過IP代理隱藏爬蟲。
第2章 環境配置
本章講解在windows10中安裝mongodb,以及如何使用Navicat連接Mongodb數據庫。
第3章 爬蟲基礎
本章講解requests模塊、HTTP請求,入門xpath基礎語法,學習lxml模塊實例化html并通過xpath解析。
第4章 項目實戰-電商網站數據抓取
本章全面細致開始爬蟲項目實戰,包括分析抓取需求、分析電商網站頁面結構、爬蟲數據解析和數據入庫。