作業要我們用Java寫一個爬蟲,我看網上和助教給出的資料,似乎是用httpclient和jsoup兩個類,但是在jsoup那里的選擇器,我看不懂,網上找了相應的資料,要么是直接照搬文檔里面的,要么是一筆帶過,完全懵逼在當場……具體問題就比如是……可以get到一大串的json數據,不知道怎么把里面的"aid":***之類的數據提取出來,這應該用怎么樣的提取條件?還是說是別的什么東西?如果還有問題,就是用java寫一個爬蟲的思路是什么,我上面的想法對嗎?不對的話應該怎么做?
7 回答

qq_冷_37
TA貢獻1條經驗 獲得超1個贊
就是jsoup 里面有幾個有幾個方法 你到網頁上? 用抓包工具 找到你想抓的東西? 你 想抓取什么 就拿到 標題? 轉下 格式 換成文檔格式? 在存到數據庫 ?就可以了 也可以打出來再? 控制臺上 你就能看見你抓的是不是 文檔格式? 是就存到數據庫 不是在轉換下格式就好了
添加回答
舉報
0/150
提交
取消