亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

請幫我看看這段爬取怎么錯了

請幫我看看這段爬取怎么錯了

慕仔8323353 2018-11-01 23:07:05
# coding=utf-8def getHTMLlines(htmlpath):? ? ? ? ?f=open(htmlpath,"r",encoding="utf-8")? ? ? ? ?ls=f.readlines()? ? ? ? ?f.close()? ? ? ? ?return lsdef extractImageUrls(htmllist):? ? ? ? ?urls=[]? ? ? ? ?for line in htmllist:? ? ? ? ? ? ? ? ? if "img"in line:? ? ? ? ? ? ? ? ? ? ? ? ? ?url=line.split("src=")[-1].split('"')[1]? ? ? ? ? ? ? ? ? ? ? ? ? ?if "http"in url:? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? urls.append(url)? ? ? ? ?return urlsdef showResults(urls):? ? ? ? ?count=0? ? ? ? ?for url in urls:? ? ? ? ? ? ? ? ? print("第{:2}個的URL:{}".format(count,url))? ? ? ? ? ? ? ? ? count +=1def saveResults(filepath,urls):? ? ? ? ?f=open(filepath,"w")? ? ? ? ?for url in urls:? ? ? ? ? ? ? ? ? f.write(url+"\n")? ? ? ? ?f.close()def main():? ? ? ? ?inputfile="F:/html/nationalgeographic.html"? ? ? ? ?outfile="F:/html/ues.txt"? ? ? ? ?htmlLines=getHTMLlines(inputfile)? ? ? ? ?imageUrls=extractImageUrls(htmlLines)? ? ? ? ?showResults(imageUrls)? ? ? ? ?saveResults(outputfile,imageUrls)main()
查看完整描述

2 回答

  • 2 回答
  • 0 關注
  • 1065 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號