爬蟲運行出出現的錯誤
craw 1 : http://baike.baidu.com/item/Python
craw failed: 'NoneType' object has no attribute 'find'
實在是不知道怎么解決了 ??
craw 1 : http://baike.baidu.com/item/Python
craw failed: 'NoneType' object has no attribute 'find'
實在是不知道怎么解決了 ??
2017-05-05
舉報
2017-05-27
我之前也遇到過這種情況,糾結了很久,最后才發現一個非常重要的問題,百度的詞條信息發生了變化,你可以仔細看看,現在不再是以 .htm結尾了,之前在html_parser模塊中的正則表達式已經失效了,原來是href=re.compile(r"/view/\d+\.htm"),現在應該改為href=re.compile(r'/item/\w+')。這也再次證明了在采集數據前,一定要對目標進行仔細認真的分析!
2017-05-09
已經解決了 ? 但是卻只爬出了一條數據 沒有任何報錯
2017-05-05
解析出錯了吧,需要解析的屬性不是href就是class_,怎么會有find
2017-05-05
看看出錯代碼在哪里啊,貼出來看看