課程
                    
                        /后端開發
                        
                            /Python
                        
                        /Python開發簡單爬蟲

爬蟲運行出出現的錯誤

craw 1 : http://baike.baidu.com/item/Python

craw failed: 'NoneType' object has no attribute 'find'

實在是不知道怎么解決了 ??

qq_藞藞呀_0

2017-05-05

源自：Python開發簡單爬蟲 7-7

關注問題我要回答

1072

操作

收起

4 回答

SiCheng_Sheen 回答被采納 +3 積分
2017-05-27

我之前也遇到過這種情況，糾結了很久，最后才發現一個非常重要的問題，百度的詞條信息發生了變化，你可以仔細看看，現在不再是以 .htm結尾了，之前在html_parser模塊中的正則表達式已經失效了，原來是href=re.compile(r"/view/\d+\.htm")，現在應該改為href=re.compile(r'/item/\w+')。這也再次證明了在采集數據前，一定要對目標進行仔細認真的分析！