一開始學爬蟲,也打算借此完成自己備份之前QQ空間日志信息的目的。參考了文章https://segmentfault.com/a/11...但是發現QQ空間整個日志列表是內嵌在一個<iframe>中的,其中的鏈接指向一個日志中轉頁面,直接打開后本無頁面顯示。無法找到準確的url,所以覺得這個問題不是那么簡單。似乎還涉及到登陸等模仿用戶行為的問題,希望做過這方面的大神指點一二,不甚感激
怎么用Node.js寫爬蟲抓取自己QQ空間的所有日志信息?
呼如林
2018-10-09 17:22:06