分析網站的access_log總是有很多噪音日志,有搜索引擎的蜘蛛,也有訂閱源什么的,非常麻煩我現在的做法是用UA的一些關鍵字做過濾,維護一個過濾列表,每分析一條就去過濾一次。我想問問,還有沒有其他更好的方案,因為過濾UA的方法,當列表很大的時候,效率非常差,而且這個列表也不一定全,需要定時去觀察數據,更新列表。
當列表很大的時候,效率非常差,還有沒有其他更好的方案?
qq_遁去的一_1
2023-04-15 17:13:41