亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

python 3.5 解析器代碼問題

name 'new_urls' is not defined

這個怎么解決

正在回答

12 回答

感覺你是最近才學的吧。如果是,建議你學習一下基礎,然后一個一個模塊的學習使用。最后再一次使用多個模塊。而且,這個視頻的python和模塊有點老,你要小心有很多坑,我就是被坑了很多次?。。?/p>

0 回復 有任何疑惑可以回復我~

http://img1.sycdn.imooc.com//58401c3b00017a8d08330775.jpg第20行中第一個new_urls

0 回復 有任何疑惑可以回復我~

http://img1.sycdn.imooc.com//58401a940001124411680700.jpg

改了,只執行了2行

0 回復 有任何疑惑可以回復我~
#1

豬豬的笨笨

你截圖中的第20行,第一個new_url加s
2016-12-01 回復 有任何疑惑可以回復我~
#2

厲害咯 提問者 回復 豬豬的笨笨

修改了,但是只爬了兩個頁面就停止了 craw 1 : http://baike.baidu.com/view/21087.htm craw 2 : http://baike.baidu.com/view/10812319.htm Process finished with exit code 0
2016-12-02 回復 有任何疑惑可以回復我~
#3

豬豬的笨笨 回復 厲害咯 提問者

可是 他沒有報錯。你的代碼其他地方出問題了。好好的看一下。我建議你 好好學一下基礎,然后一個模塊一個模塊的編寫代碼,測試。最后再把多個模塊串聯起來寫成一個程序0.0
2016-12-04 回復 有任何疑惑可以回復我~

第一個new_url加上s就好了

0 回復 有任何疑惑可以回復我~
#1

厲害咯 提問者

哪兒的?
2016-12-01 回復 有任何疑惑可以回復我~

第20行,new_url沒有s

0 回復 有任何疑惑可以回復我~
#調度程序
import?url_manager,?html_downloader,?html_parser,?html_outputer

class?SpiderMain(object):

????def?__init__(self):
????????self.urls?=?url_manager.UrlManager()
????????self.downloader?=?html_downloader.HtmlDownloader()
????????self.parser?=?html_parser.HtmlParser()
????????self.outputer?=?html_outputer.HtmlOutputer()

????def?craw(self,root_url):
????????count?=?1
????????self.urls.add_new_url(root_url)
????????while?self.urls.has_new_url():
????????????try:
????????????????new_url?=?self.urls.get_new_url()
????????????????print('craw?%d?:?%s'?%?(count,new_url))
????????????????html_cont?=?self.downloader.download(new_url)
????????????????new_url,new_data?=?self.parser.parse(new_url,html_cont)
????????????????self.urls.add_new_urls(new_urls)
????????????????self.outputer.collect_data(new_data)

????????????????if?count?==?1000:
????????????????????break

????????????????count?=?count?+?1
????????????except?Exception?as?err:
????????????????print(err)

????????self.outputer.output_html()


if?__name__?==?"__main__":
????root_url?=?"http://baike.baidu.com/view/21087.htm"
????obj_spider?=?SpiderMain()
????obj_spider.craw(root_url)


0 回復 有任何疑惑可以回復我~

美女,是你的spider_main文件出問題了。貼出來spider_main文件

0 回復 有任何疑惑可以回復我~
#1

厲害咯 提問者

貼出來了,麻煩幫忙檢查一下,謝謝
2016-12-01 回復 有任何疑惑可以回復我~

http://img1.sycdn.imooc.com//58401603000124db08920224.jpg

只執行了一個

0 回復 有任何疑惑可以回復我~

報錯的東西截圖出來

0 回復 有任何疑惑可以回復我~
#1

厲害咯 提問者

只執行了一個就報錯了
2016-12-01 回復 有任何疑惑可以回復我~

我用的是python3.5

0 回復 有任何疑惑可以回復我~
首頁上一頁12下一頁尾頁

舉報

0/150
提交
取消
Python開發簡單爬蟲
  • 參與學習       227596    人
  • 解答問題       1288    個

本教程帶您解開python爬蟲這門神奇技術的面紗

進入課程

python 3.5 解析器代碼問題

我要回答 關注問題
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號