用java編寫爬蟲是不是很簡單
1 回答

瀟湘沐
TA貢獻1816條經驗 獲得超6個贊
用java編寫爬蟲, 有豐富的第三方包, 使用起來比較容易
JSOUP : 強大的HMTL解析能力, 但抓取能力較弱.
HttpClient: 強大專業的爬取能力.功能強大, 代碼量較多. 解析起來稍微麻煩點
HtmlUnit: 可以模擬瀏覽器.沒有界面,可以模擬填表,模擬點擊等,甚至還支持JavaScript.但是內存占用較多,速度較慢.
一般根據需要,進行搭配使用
經常使用的搭配.
1 | HttpClient 爬取---->Jsoup解析-->MySQL存儲 |
添加回答
舉報
0/150
提交
取消