亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

python正則表達式

難度初級
時長 1小時29分
學習人數
綜合評分9.40
211人評價 查看評價
9.7 內容實用
9.4 簡潔易懂
9.1 邏輯清晰
建議遇到問題的同學先修改以下三處代碼
listurl = re.findall(r'//.+?\.jpg*', buf) #匹配src中的內容

f = open('D:/picture/' + str(i) + '.jpg', 'wb') #將圖片存到D盤下的picture中
req = urllib2.urlopen('http:'+url) #爬取圖片
listurl = re.findall(r'//.+?\.jpg*', buf)
建議讀一下廖雪峰的正則表達式 再來看 會理解很多
個人覺得廖雪峰老師的邏輯清晰很多
compile=complete,pattern=partner……
i = 0
old_url = ''
for _url in listurl:
f = open(str(i)+'.jpg','wb')
url = 'http:'+_url
if url == old_url:
continue
old_url = url
#print (url,'')
req = request.urlopen(url)
buf = req.read()
f.write(buf)
i += 1
f.close()
print ('download %s '%(i))
Python3.6版本
from urllib import request
import re

url = 'http://www.xianlaiwan.cn/course/list'
req = request.urlopen(url)

buf = req.read()
buf = buf.decode('utf-8')

listurl = re.findall(r'\/\/img.+?\.jpg',buf)

#for _url in listurl:
# print(_url)
老師順便講了個小爬蟲,厲害厲害

\豎大拇指
打完收工了

已采納回答 / qq_愛吃羊的鯨魚_0
\1就是代表了前面“([\w]+>)”這些內容,你將\1替換掉就成了ma=re.match(r'<([\w]+>)[\w]+</([\w]+>)','<book>python</book>')? 其中括號已經沒有意義,去掉后就變成ma=re.match(r'<[\w]+>[\w]+</[\w]+>','<book>python</book>')? 這樣看就應該沒問題了吧。后面加1匹配不出來的原因也是應為&...
應該用非貪婪匹配 r&#039;src=.+?\.jpg&#039;

最新回答 / qq_琪_10
我知道了,match函數是從字符串的開始匹配的,正則表達式的每一部分都跟字符串的開始匹配

最贊回答 / 華燈初上丶
import reimport urllibreq = urllib.request.urlopen('http://www.xianlaiwan.cn/course/list')#此處加上decode(),不然拿下來的數據都是亂碼buf = req.read().decode("utf-8")#老師講課的url地址已經發生改變,改一下正則匹配就好# listurl = re.findall(r'src=.+\.jpg', buf)listurl = re.findall(r'//img.+?\.jpg', bu...
課程須知
本課程是Python中級課程 1、本課程在linux講解,最好有linux開發環境 1、熟練掌握Python開發語言基礎語法
老師告訴你能學到什么?
1.正則表達式基本語法 2.使用re模塊處理文本

微信掃碼,參與3人拼團

微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

友情提示:

您好,此課程屬于遷移課程,您已購買該課程,無需重復購買,感謝您對慕課網的支持!

本次提問將花費2個積分

你的積分不足,無法發表

為什么扣積分?

本次提問將花費2個積分

繼續發表請點擊 "確定"

為什么扣積分?

舉報

0/150
提交
取消