亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

為什么下面的代碼爬不出圖片(想爬妹子^_^)

from urllib import request
from bs4 import BeautifulSoup
import ssl
ssl._create_default_https_context = ssl._create_unverified_context
f = request.urlopen("https://www.zhihu.com/question/29815334")
html = f.read()
soup = BeautifulSoup(html, "html5lib")
# print(soup.prettify())
p = soup.select("img")
# print(p[2])
# for i in p:
# ? ? print(i)
# x = p[0]["src"]
# print(x)
i = 0
while True:
? ?x = p[i]["src"]
? ?name = "/Users/lcycq/Desktop/BT/%d.jpg"%i
? ?i += 1
? ?if i >= len(p):
? ? ? ?break
? ?if not x.startswith('http'):
? ? ? ?continue
? ?request.urlretrieve(x, filename='name')

正在回答

1 回答

print一下最開始的html,如果輸出不行或者亂碼的話,先decode('utf-8),然后沒有網址的圖片具體目標分析,應該是解析網頁圖片哪里出現了錯誤,有些不一定是src標簽里面的或許。

0 回復 有任何疑惑可以回復我~
#1

lcycq 提問者

謝謝,后來找到原因了,是最后name多加了引號?
2017-06-01 回復 有任何疑惑可以回復我~

舉報

0/150
提交
取消
初識Python
  • 參與學習       758390    人
  • 解答問題       8967    個

學python入門視頻教程,讓你快速入門并能編寫簡單的Python程序

進入課程

為什么下面的代碼爬不出圖片(想爬妹子^_^)

我要回答 關注問題
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號