亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

一個Python的爬蟲,有一個地方不懂,望大神解答

一個Python的爬蟲,有一個地方不懂,望大神解答

蠱毒傳說 2018-07-17 15:08:11
for link in links:    if('href'in dict(link.attrs)):            url = urljoin(page,link['href'])        if url.find("'")!=-1:continue #就是這就話,為什么要找"'"?        url=url.split('#')[0]        if url[0:4]=='http' and not self.isindexed(url):            ewpages.add(url)        LinkText=self.gettextonly(link)        self.addlinkref(page,url,LinkText) <span></span>還是這段話,下面這段話if('href'in dict(link.attrs))這里面dict的作用是什么,沒有dict會怎么樣?
查看完整描述

2 回答

?
阿晨1998

TA貢獻2037條經驗 獲得超6個贊

這里dict是python中的一個標準函數,意思是將link標記中的屬性轉換成一個字典(k,v),而這里in的意思是看看href這個屬性是否在attrs里出現,默認的link.attrs應該返回的是一個list來的(我猜的)

查看完整回答
反對 回復 2018-07-18
?
繁星淼淼

TA貢獻1775條經驗 獲得超11個贊

如果link.attrs返回的是屬性和值組合的list,那么查找起來就相對麻煩一點,如果轉換成dict查找就會方便很多

查看完整回答
反對 回復 2018-07-18
  • 2 回答
  • 0 關注
  • 560 瀏覽

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號