亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

一個困惑了很久的爬蟲問題

一個困惑了很久的爬蟲問題

浮云間 2018-07-31 05:10:00
http://app1.sfda.gov.cn/datasearch/face3/content.jsp?tableId=41&tableName=TABLE41&tableView=%E8%8D%AF%E5%93%81%E7%BB%8F%E8%90%A5%E4%BC%81%E4%B8%9A&Id=4 這個網址,瀏覽器能正常訪問,但是使用代碼(jsoup、crawler4j、phantomjs都試過了)去訪問,就只能拿到js。拿不到想要的數據,是什么原因呢?經過不斷摸索,發現是cookie過期時間很短,很快就失效了,求解決辦法。貼個jsoup代碼吧
查看完整描述

1 回答

?
縹緲止盈

TA貢獻2041條經驗 獲得超4個贊

它的頁面會重新生成cookie,你要分析js,你清除該網站所有cookie,會發現第一次請求的時候有一個返回302的請求.那個是返回加密過的js代碼,直接看代碼看不懂,要調試才能知道一些,而且這個是給window處理的.

我試過瀏覽器模擬,可以獲取數據.

代碼獲取較麻煩,需要處理幾乎每個頁面都重新生成的FSSBBIl1UgzbN7N80T,暫時還未解決,如果你有進展麻煩回復,謝謝.


查看完整回答
反對 回復 2018-08-19
  • 1 回答
  • 0 關注
  • 697 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號