spider_main.py中的from baike_spider import url_manager問題
baike_spider是在工程下面創建的package,里面是空的,那from baike_spider import url_manager,html_downloader,html_parser,html_outputer這句代碼,又怎么從baike_spider模塊中引入(import)? url_manager呢?
我按照視頻里面的代碼打出來,運行后紙爬取了講個網址就結束了。我懷疑是不是因為(package)baike_spider為空引起的,求大神指導
2017-05-18
第一:baike_spider是你創建的包,你所說的url_manager肯定是放在包中的代碼,是可以import進去了。
第二:只爬取一個網址就結束應該是html_parser中的代碼有問題,比如課程中的匹配策略與現在的百度Python詞條不匹配,需要改成href = re.compile(r"/item/.*") ? 再或者find_all ?不要丟了下劃線,我就沒注意到下劃線,所以只輸出了1條記錄就craw faild了。
2017-06-26
那為什么我用的pycharm 里baike_spider中沒有url_manager,html_downloader,html_parser,html_outputer
url_manager,html_downloader,html_parser,html_outputer都是錯誤Imort Error