課程
                    
                        /后端開發
                        
                            /Python
                        
                        /python正則表達式

為什么爬不到網頁的地址啊，顯示列表是空的

如圖，listurl是空的列表，用的python3

慕蓋茨5251222

2017-11-25

源自：python正則表達式 4-2

關注問題我要回答

1695

操作

收起

3 回答

華燈初上丶
2018-01-27

我用的pycharm，今天才手寫的代碼，改了幾個小地方，都寫在注釋里面，樓主看看注意到沒有，謝謝。

import re

import urllib

req = urllib.request.urlopen('http://www.xianlaiwan.cn/course/list')

#此處加上decode()，不然拿下來的數據都是亂碼

buf = req.read().decode("utf-8")

#老師講課的url地址已經發生改變，改一下正則匹配就好

# listurl = re.findall(r'src=.+\.jpg', buf)

listurl = re.findall(r'//img.+?\.jpg', buf)

# 改成非貪婪模式就行了

#前面沒有了http：，那么這里手動加上

for index,app_id in enumerate(listurl):

? ? listurl[index] = str(app_id).replace('//', 'http://')

? ? print(index, listurl[index])

print(listurl)

i = 0

for url in listurl:

? ? #寫入模式修改為“wb+”，不然不支持將bytes寫入，親測

? ? f = open(str(i)+".jpg", "wb+")

? ? req = urllib.request.urlopen(url)

? ? buf = req.read()

? ? f.write(buf)

? ? i+=1

1 回復有任何疑惑可以回復我~

收起回答

華燈初上丶
2018-01-27

問題就是老師講課的時候圖片地址是你所寫的，但是現在已經變成了

//img1.sycdn.imooc.com//598027a90001df8006000338-240-135.jpg

稍微修改一下就可以用了

0 回復有任何疑惑可以回復我~

收起回答

慕UI3135669
2017-11-28

正則表達式寫錯了吧，是r''不是br''

0 回復有任何疑惑可以回復我~

收起回答

舉報

0/150

提交

取消

python正則表達式

參與學習 80571 人
解答問題 176 個

如何使用正則處理文本，帶你對python正則有個全面了解

進入課程

本課相似問答

1 回答爬取的地址寫入問題

1 回答為何爬京東首頁的圖片失敗啊

1 回答尷尬的問一下，爬取圖片后為什么找不到圖片

2 回答不知道為什么，同樣的正則表達式，python2爬取的鏈接都正確，python3爬取的鏈接返回的url_list有個別錯誤，有誰知道是什么原因嗎？

1 回答為什么下面這句代碼匹配為空呢? 正則表達式不是去匹配"123abc"中的子串嗎？"abc"是符合表達式要求的啊

搜索更多本課相關問答

為什么爬不到網頁的地址啊，顯示列表是空的

我要回答關注問題

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

為什么爬不到網頁的地址啊，顯示列表是空的

3 回答

本課相似問答

為什么爬不到網頁的地址啊，顯示列表是空的

為什么爬不到網頁的地址啊，顯示列表是空的