已解決430363個問題，去搜搜看，總會有你想問的

關于監測頁面變化與定時爬取增量的問題

首頁猿問關于監測頁面變化與定時爬取增量的問題

關于監測頁面變化與定時爬取增量的問題

Python

慕斯709654 2018-10-22 22:27:49

有一個項目，我要對頁面每天19點開始爬，每隔30分鐘爬取一次，直到爬取到增量內容后停止，然后明日19點再循環。配置如下@every(minutes=30) def on_start(self): ...@config(age=24 * 60 * 60) def index_page(self, response): ...這樣設置，every=每30分鐘，age=每24小時，可以起到定時啟動的效果嗎？如果要發起每天19點開始的定時功能，除了第一次在19點點run之外，還有沒有更合適的方法？此外，該項目的網頁，在內容相同的情況下，URL會變化。請問除了手動對比本地數據庫之外，有沒有更合適的辦法去監測從而只爬取增量？

查看完整描述

1 回答

慕絲7291255

TA貢獻1859條經驗獲得超6個贊

第一個問題自己解決了：
調用Python的時間日期接口，用if判斷即可。
第二個問題，由于URL會變動，也許我給出的是目前唯一可用的方法。

反對回復 2018-10-22

1 回答
0 關注
729 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

關于監測頁面變化與定時爬取增量的問題

關于監測頁面變化與定時爬取增量的問題

1 回答

添加回答