課程
                    
                        /后端開發
                        
                            /Python
                        
                        /python正則表達式

新手求解，謝謝

import urllib.request
import re

req = urllib.request.urlopen('http://www.xianlaiwan.cn/course/list')
buf = req.read().decode('utf-8')
listurl = re.findall(r'http:.+\.jpg',buf)
print(listurl)

i = 0
for url in listurl:
??? f = open(str(i)+'.jpg','wb')
??? req = urllib.request.urlopen(url)
??? buf = req.read()
??? f.write(buf)
??? i += 1
??? f.close()

出現問題：

清一色610

2017-08-01

源自：python正則表達式 4-2

關注問題我要回答

1489

操作

收起

2 回答

慕粉3606827 回答被采納 +2 積分
2017-08-03

我自己試了一下，發現會讀取出這種如圖1的結果，我個人猜測是因為在正則表達式中使用了+這個貪婪模式的字符，所以會盡量匹配多的字符，所以看圖中就知道，它把兩個地址的字符串都匹配進去了，因為兩個字符串連接在一起也是http開頭，.jpg結尾的，把“listurl = re.findall(r'http:.+\.jpg',buf)”改成“listurl = re.findall(r'http:.+?\.jpg',buf)”，讀取的結果就正確了。以上是個人觀點，如有不足之處還望指出。