已解決430363個問題，去搜搜看，總會有你想問的

Scrapy抓取新聞

關注

首頁猿問 Scrapy抓取新聞

德瑪西亞99 2018-07-16 12:13:26

最近使用scrapy抓取新浪智能家居新聞(http://tech.sina.com.cn/smart/),該新聞是動態生成的，請問使用什么辦法可以抓取到。

查看完整描述

3 回答

蠱毒傳說

TA貢獻1895條經驗獲得超3個贊

爬蟲對于ajax的內容處理確實是個問題啊，可以自己用pywebkit引擎做一個，調用里面的js引擎處理那些動態生成的內容，但是難度有點高，另一個方法是找到ajax請求的接口，然后自己構造請求讀取數據然后處理返回的數據一般都是json格式。個人覺得第二種方法更簡便一點

反對回復 2018-07-17

12345678_0001

TA貢獻1802條經驗獲得超5個贊

做通用采集工具，還是用瀏覽器內核等待頁面加載完成再采集吧 phantomjs不錯的
當然這樣性能肯定沒定制開發好

反對回復 2018-07-17

牧羊人nacy

TA貢獻1862條經驗獲得超7個贊

請問python社區在哪里？

哥新手學scrapy，例子入門估計已經卡一大半人

第一個例子問題我算是搞定了，但是第二個問題馬上來了

我想爬了這個網頁，再根據這個網頁的鏈接爬另外一個網頁，怎么做？

哪里有人回答這些問題，或者方向（python語法和執行框架不懂也

反對回復 2018-07-17

關注

舉報

0/150

提交

取消