亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

python正則表達式

難度初級
時長 1小時29分
學習人數
綜合評分9.40
211人評價 查看評價
9.7 內容實用
9.4 簡潔易懂
9.1 邏輯清晰
req = urllib2.urlopen('http://www.xianlaiwan.cn/course/list')
buf = req.read()
listUrl = re.findall(r'src=.+\.jpg"', buf)
listUrl2 = []
for u in listUrl:
listUrl2.append(re.search(r'http:.+\.jpg', u).group())
i = 0
會得到兩個圖片地址,所以先得到src="",然后重新查找得到
老師這個就是在windows上啊,你下一個xshell就行了
看書一直沒有看懂,聽了課之后幫助很大,666
應該改成[a-zA-Z0-9]{6}@163\.com。
如果“.”前面沒有加"\",那“.”就是匹配任意一個字符。
https://github.com/guyunzh/crawler_imooc_jpg

我增加了幾個功能,老師爬取的只是一個頁面的圖片,我的可以自己在想創建的地方保存圖片,切可以保存多個頁面的圖片,手動輸入想要爬取的頁面個數,就可以自動創建對應的文件夾來保存對應的頁面圖片,還可以去重。
仍有很多完善的地方,但是,畢竟自己會爬取了
感覺好的點個star,謝謝哈
感覺加了很多中括號我的邏輯很難理清楚啊。
\<number> 是之前分組()的內容,?p<name>和?p=name 和\<number>的目的是一樣的,對之前分組的一個引用,不過當有多個分組時 可以用?p<name>標記。引用,更方便
re模塊中有 compile match等功能函數 可用 dir(re)查看re的所有屬性。s=re.compile(r'***')定義一種匹配字符串規則,s指向。y=s.match(' '),用match函數匹配s規則的字符串,并返回結果。dir(y),查看屬性,y.group()輸出匹配結果。謝謝老師,講的很好,希望沒理解錯。
分組編號,,這塊太難了。。沒搞明白
邏輯很混亂,還不如自己去看文檔。
評論總有人不滿意,哪來那么多事,嫌看不懂你去看文檔啊
https://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001386832260566c26442c671fa489ebc6fe85badda25cd000
廖雪峰老師的一頁紙比這深入淺出多了,這個視頻講得太亂了,思路不夠清晰,排版不好。不想說什么,可汗學院也沒這么不走心啊
排版太差,在IDE和terminal之間切換不好,在IDE里的代碼不利于規整的教學。
也不解釋一下compile,調用re里的方法的時候,實際上都有一個先編譯(compile)的過程,把compile顯式寫出來只是加快速度,節省調用方法時的反復編譯,這個東西完全可以放到后面提一下,但是直接實例化了之后(還把代碼上下之間分開了寫),容易把人搞暈
課程須知
本課程是Python中級課程 1、本課程在linux講解,最好有linux開發環境 1、熟練掌握Python開發語言基礎語法
老師告訴你能學到什么?
1.正則表達式基本語法 2.使用re模塊處理文本

微信掃碼,參與3人拼團

微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

友情提示:

您好,此課程屬于遷移課程,您已購買該課程,無需重復購買,感謝您對慕課網的支持!

本次提問將花費2個積分

你的積分不足,無法發表

為什么扣積分?

本次提問將花費2個積分

繼續發表請點擊 "確定"

為什么扣積分?

舉報

0/150
提交
取消