網上老是有人說自己寫的爬蟲繞開 會員登錄 去下載只有會員才能看的小說,這是如何實現的?謝謝!!1
2 回答

Helenr
TA貢獻1780條經驗 獲得超4個贊
服務器端并不能識別你的程序是瀏覽器還是爬蟲,瀏覽器本身也是程序,只要爬蟲在傳輸數據上表現和瀏覽器完全一樣,理論上瀏覽器能看到的東西爬蟲都能看到。
服務器一般是靠cookie來區分登陸還是非登陸用戶,只要爬蟲攜帶認證后的用戶的cookie,對于服務器那邊來說,會認為你是個登陸后的會員用戶,便把登陸后的信息返回給你了。
這種方式本身還是要有個合法的會員信息的,用現成cookie也好,靠爬蟲模擬登陸新生成的cookie也好,沒有這個的話是無法表明你是個會員用戶的,所謂繞開會員登錄只是一個宣稱手段罷了。

拉丁的傳說
TA貢獻1789條經驗 獲得超8個贊
我也??葱≌f,小說的登陸為了方便都是cookie存儲的,
估計爬蟲讀出瀏覽器中所有cookie循環登陸的
你給cookie的key,val都加密,再在一定時間內登陸超過一定的次數就不允許登陸
- 2 回答
- 0 關注
- 412 瀏覽
添加回答
舉報
0/150
提交
取消