亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

<label id="vnun8"></label>

已解決430363個問題，去搜搜看，總會有你想問的

Python爬蟲抓取當當網圖片時，正則表達式沒有匹配到鏈接地址

關注

首頁猿問 Python爬蟲抓取當當網圖片時，...

Python爬蟲抓取當當網圖片時，正則表達式沒有匹配到鏈接地址

Python

大話西游666 2018-07-22 11:14:58

最近正在學Python爬蟲，從最基礎的學起，即用 urllib 和 re 這兩個包學抓取。用教材（韋瑋《精通Python網絡爬蟲》）第77頁的方法爬京東的圖片完全沒問題，但想照貓畫個虎，爬一下當當網兒童圖書版塊的圖片，卻怎么也行不通，用正則表達式做的 pattern，死活就是沒有匹配到任何鏈接地址。當當網初始頁面：http://category.dangdang.com/pg1-cp01.41.26.00.00.00.html求大神指正！

查看完整描述

1 回答

小怪獸愛吃肉

TA貢獻1852條經驗獲得超1個贊

修改第4、5兩行如下，貌似就解決問題了：

     s = str(urllib.request.urlopen(url).read().decode(encoding='gbk'))     
     p = re.compile("<img data-original='(.+?)'", re.S)

編碼真的是個麻煩的問題，正則表達式也是，看來得多練習才行！

反對回復 2018-08-14

1 回答
0 關注
813 瀏覽

關注

添加回答

舉報

0/150

提交

取消

微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

Python爬蟲抓取當當網圖片時，正則表達式沒有匹配到鏈接地址

Python爬蟲抓取當當網圖片時，正則表達式沒有匹配到鏈接地址

1 回答

添加回答

Python爬蟲抓取當當網圖片時，正則表達式沒有匹配到鏈接地址