for link in links: if('href'in dict(link.attrs)): url = urljoin(page,link['href']) if url.find("'")!=-1:continue #就是這就話,為什么要找"'"? url=url.split('#')[0] if url[0:4]=='http' and not self.isindexed(url): ewpages.add(url) LinkText=self.gettextonly(link) self.addlinkref(page,url,LinkText) <span></span>還是這段話,下面這段話if('href'in dict(link.attrs))這里面dict的作用是什么,沒有dict會怎么樣?
一個Python的爬蟲,有一個地方不懂,望大神解答
蠱毒傳說
2018-07-17 15:08:11