課程
                    
                        /后端開發
                        
                            /Python
                        
                        /python正則表達式

新手，不知道怎么解決

>>> i=0

>>> for url in listurl:

f=open('E:/python/mi/'+str(i)+'.jpg','wb')

req=urllib2.urlopen(url)

buf=req.read()

f.write(buf)

i+=1

Traceback (most recent call last):

? File "<pyshell#14>", line 3, in <module>

? ? req=urllib2.urlopen(url)

? File "C:\Program Files\IBM\SPSS\Statistics\22\Python\lib\urllib2.py", line 126, in urlopen

? ? return _opener.open(url, data, timeout)

? File "C:\Program Files\IBM\SPSS\Statistics\22\Python\lib\urllib2.py", line 384, in open

? ? protocol = req.get_type()

? File "C:\Program Files\IBM\SPSS\Statistics\22\Python\lib\urllib2.py", line 245, in get_type

? ? raise ValueError, "unknown url type: %s" % self.__original

ValueError: unknown url type: src="http://c1.mifile.cn/f/i/2014/cn/placeholder-220!110x110.png" data-src="http://c1.mifile.cn/f/i/g/2015/xiaomiNOTE2-320-220!160x110.jpg" srcset="http://c1.mifile.cn/f/i/g/2015/xiaomiNOTE2-320-220!320x220.jpg

慕俠2747441

2017-05-04

源自：python正則表達式 4-2

關注問題我要回答

1530

操作

收起

4 回答

華燈初上丶
2018-01-27

我用的pycharm，今天才手寫的代碼，改了幾個小地方，都寫在注釋里面，樓主看看注意到沒有，謝謝。

import re

import urllib

req = urllib.request.urlopen('http://www.xianlaiwan.cn/course/list')

#此處加上decode()，不然拿下來的數據都是亂碼

buf = req.read().decode("utf-8")

#老師講課的url地址已經發生改變，改一下正則匹配就好

# listurl = re.findall(r'src=.+\.jpg', buf)

listurl = re.findall(r'//img.+?\.jpg', buf)

# 改成非貪婪模式就行了

#前面沒有了http：，那么這里手動加上

for index,app_id in enumerate(listurl):

? ? listurl[index] = str(app_id).replace('//', 'http://')

? ? print(index, listurl[index])

print(listurl)

i = 0

for url in listurl:

? ? #寫入模式修改為“wb+”，不然不支持將bytes寫入，親測

? ? f = open(str(i)+".jpg", "wb+")

? ? req = urllib.request.urlopen(url)

? ? buf = req.read()

? ? f.write(buf)

? ? i+=1

? ? f.close()

2 回復有任何疑惑可以回復我~

收起回答

ECNUGHOST
2018-01-18

我也是這個情況。。。

0 回復有任何疑惑可以回復我~

收起回答

qq_天涯_45
2017-05-08

import?urllib2,re
req?=?urllib2.urlopen('http://www.xianlaiwan.cn/course/list')
buf?=?req.read()
listurl?=?re.findall(r'http:.+\.jpg',buf)
print?listurl[1]

i=0
for?url?in?listurl:
????f?=?open(str(i)+'.jpg','wb')
????req?=?urllib2.urlopen(url)
????buf?=req.read()
????f.write(buf)
????i+=1

0 回復有任何疑惑可以回復我~

收起回答

qq_天涯_45
2017-05-08

import?urllib2,re
req?=?urllib2.urlopen('http://www.xianlaiwan.cn/course/list')
buf?=?req.read()
listurl?=?re.findall(r'http:.+\.jpg',buf)
print?listurl[1]

i=0
for?url?in?listurl:
????f?=?open(str(i)+'.jpg','wb')
????req?=?urllib2.urlopen(url)
????buf?=req.read()
????f.write(buf)
????i+=1

0 回復有任何疑惑可以回復我~

收起回答

舉報

0/150

提交

取消

python正則表達式

參與學習 80571 人
解答問題 176 個

如何使用正則處理文本，帶你對python正則有個全面了解

進入課程

本課相似問答

3 回答新手求解，謝謝

2 回答這個問題怎么解決啊

3 回答用的python3，出現這個問題，請問大神怎么解決

2 回答有個問題非常難懂，我不知道該任何學起

2 回答str1='num1'='100'出現SyntaxError: can't assign to literal錯誤怎么解決

搜索更多本課相關問答

新手，不知道怎么解決

我要回答關注問題

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

新手，不知道怎么解決

4 回答

本課相似問答

新手，不知道怎么解決

新手，不知道怎么解決

新手，不知道怎么解決