講師回答 / Peter
一般來說curl下載下來的內容關注的是數據,而html的解析放到瀏覽器里面對齊很有可能是不同的,因為css也會影響頁面布局,不同的瀏覽器也會有不同。但是,顯示在頁面上面的數據應該是沒問題的。
2014-08-29
講師回答 / Peter
只能夠單獨抓取,這個是硬傷。比如頁面當中的數據如果是通過Ajax來動態獲取的話,curl也是無法拿到這些動態數據的。這兩點應該說是curl的使用限制。對于你這個情況,如果能夠知道這個frame的url,那么直接抓取它也許就能夠幫助你解決這個問題了。如果完整數據是合并起來的,也就是一部分數據在當前頁面,一部分在frame里面。那么就只能先抓取當前頁面,然后解析當前頁面的html,找到這個frame的src,然后再次抓取這個frame的page,最后把兩個頁面的數據合并起來。
2014-08-17