-
Python正則表達式
查看全部 -
構造句法規則, 匹配字符, 爬蟲抓取查看全部
-
抓取網頁中的圖片到本地:
抓取網頁
import urllib2
req=urllib2.urlopen(url)
buf=req.read()
獲取圖片地址
抓取圖片內容并保存到本地
查看全部 -
re的其他方法
查看全部 -
re的其他方法
查看全部 -
正則表達式語法
查看全部 -
正則表達式匹配前后端
查看全部 -
正則表達式匹配多個字符
查看全部 -
正則表達式匹配單個字符
查看全部 -
ma = re.match(pattern, string, flag)
ma.group()
查看全部 -
re.compile(pattern, re.IGNORECASE) 忽略大小寫
pa = re.compile(r'(imooc)')
ma = pa.match('imooc python')
ma.group() =>'imooc'
ma.groups() =>('imooc',)
查看全部 -
import re
pa = re.compile(r'imooc')
ma = pa.match('imooc python')
ma.group() 返回匹配的字符串或元組
ma.span() 返回匹配位置
ma.string 返回待匹配的字符串
ma.re 返回正則表達式
查看全部 -
正則表達式概念
查看全部 -
課程主要內容
查看全部 -
求解釋每一步是什么意思?不明白
i = 0
for url in listurl:
? ?file = open('D:/python/'+str(i)+'.jpg','w')
? ?req = urllib2.urlopen(url)
? ?buf = req.read()
? ?file.write(buf)
? ?i += 1
? ?time.sleep(1)第一步,初始化變量i=1。
第二步,遍歷URL列表中的每一個圖片的URL
????????第三步,打開一個文件并返回一個文件對象file,如果文件不存在,則創建文件,w是以只寫的方式打開
????????第四步,用urlopen()方法遠程請求url的數據并返回一個文件對象req
????????第五步,讀取文件對象的內容,保存到變量buf
????????第六步,將內容寫到file里面
????????第七步,i 自增,也就是通過變量自增達到文件名不能相同的目的
????????第八步,調用time模塊的sleep()方法,可以將程序在這一步暫停1秒鐘
????????第九步,關閉文件對象,老師沒有寫,file.close(),這句盡量要寫,否則文件可能有問題,具體自己了解吧
沒了~。~
查看全部
舉報