課程
                    
                        /后端開發
                        
                            /Python
                        
                        /Python開發簡單爬蟲

為什么只有第一個就顯示了一個failed不動了

為啥第一個后面的就只有一個failed

你這樣年輕

2016-01-01

源自：Python開發簡單爬蟲

關注問題我要回答

1091

操作

收起

1 回答

blacksea3 回答被采納 +3 積分
2016-02-16

剛看到一個最近的相似的問題-_-||

有可能你的try-except中間的print 'craw %d : %s' %(count, new_url)到except那一塊某個地方使用的代碼打錯了而不是self.urls.has_new_url()==0導致的錯誤，python的百科里面是有別的鏈接的，你可以試著把try-except去掉，讓錯誤直接顯示出來

中間這一塊指的是：

html_cont=self.downloader.download(new_url)
new_urls,new_data=self.parser.parse(new_url,html_cont)
self.urls.add_new_urls(new_urls)
self.outputer.collect_data(new_data)
if count==1000:
? ?break
count=count+1
根據錯誤位置設置print 相應的變量查看錯誤原因.

比如說我一開始就是url_manager.py的UrlManager類的add_new_urls方法打錯了，導致的錯誤