亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

關于java的爬蟲問題?

關于java的爬蟲問題?

迦爾納 2017-01-05 20:03:38
作業要我們用Java寫一個爬蟲,我看網上和助教給出的資料,似乎是用httpclient和jsoup兩個類,但是在jsoup那里的選擇器,我看不懂,網上找了相應的資料,要么是直接照搬文檔里面的,要么是一筆帶過,完全懵逼在當場……具體問題就比如是……可以get到一大串的json數據,不知道怎么把里面的"aid":***之類的數據提取出來,這應該用怎么樣的提取條件?還是說是別的什么東西?如果還有問題,就是用java寫一個爬蟲的思路是什么,我上面的想法對嗎?不對的話應該怎么做?
查看完整描述

7 回答

?
qq_蝦米_7

TA貢獻1條經驗 獲得超2個贊

jsoup用的選擇器和css的一樣 ,可以直接解析那個頁面? 然后用那些選擇器獲取你需要你的內容就可以了

查看完整回答
2 反對 回復 2018-01-25
?
慕桂英2430531

TA貢獻1條經驗 獲得超2個贊

我也很懵逼??能教我么

查看完整回答
2 反對 回復 2017-04-07
?
qq_冷_37

TA貢獻1條經驗 獲得超1個贊

就是jsoup 里面有幾個有幾個方法 你到網頁上? 用抓包工具 找到你想抓的東西? 你 想抓取什么 就拿到 標題? 轉下 格式 換成文檔格式? 在存到數據庫 ?就可以了 也可以打出來再? 控制臺上 你就能看見你抓的是不是 文檔格式? 是就存到數據庫 不是在轉換下格式就好了


查看完整回答
1 反對 回復 2018-01-22
?
迦爾納

TA貢獻3條經驗 獲得超0個贊


目前可以知道的是,我所得到的那串數據就是json數據,所以需要解析他……我一臉茫然……數據沒有數組[],但是實際上卻又大同小異,懵逼ing

查看完整回答
反對 回復 2017-01-05
  • qq_蝦米_7
    qq_蝦米_7
    就是json格式 你可用jsonpath解析 網上有教程 很方便的
  • 7 回答
  • 2 關注
  • 2551 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號