亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

Scrapy抓取新聞

Scrapy抓取新聞

德瑪西亞99 2018-07-16 12:13:26
最近使用scrapy抓取新浪智能家居新聞(http://tech.sina.com.cn/smart/),該新聞是動態生成的,請問使用什么辦法可以抓取到。
查看完整描述

3 回答

?
蠱毒傳說

TA貢獻1895條經驗 獲得超3個贊

爬蟲對于ajax的內容處理確實是個問題啊, 可以自己用pywebkit引擎做一個,調用里面的js引擎處理那些動態生成的內容,但是難度有點高, 另一個方法是找到ajax請求的接口,然后自己構造請求讀取數據 然后處理返回的數據 一般都是json格式。個人覺得第二種方法更簡便一點

查看完整回答
反對 回復 2018-07-17
?
12345678_0001

TA貢獻1802條經驗 獲得超5個贊

做通用采集工具,還是用瀏覽器內核等待頁面加載完成再采集吧 phantomjs不錯的
當然這樣性能肯定沒定制開發好

查看完整回答
反對 回復 2018-07-17
?
牧羊人nacy

TA貢獻1862條經驗 獲得超7個贊

請問python社區在哪里?

哥新手學scrapy,例子入門估計已經卡一大半人

第一個例子問題我算是搞定了,但是第二個問題馬上來了

我想爬了這個網頁,再根據這個網頁的鏈接爬另外一個網頁,怎么做?

哪里有人回答這些問題,或者方向(python語法和執行框架不懂也


查看完整回答
反對 回復 2018-07-17
  • 3 回答
  • 0 關注
  • 514 瀏覽

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號