話說同志們在爬取數據的時候如何保存已經訪問過的url和隊列?對于爬取過的url,我使用redis的set來保存,訪問隊列是用list來保存,數據量是直線上升,內存不大,也只有4g,扛不住。不知道以前的方法是什么?
爬蟲如何保存已經訪問過的url
郎朗坤
2019-04-07 09:37:37