亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

在頁面上抓取后清空的 html 標記

在頁面上抓取后清空的 html 標記

喵喔喔 2022-09-13 17:26:04
我試圖抓取網站:http://finance.sina.com.cn/futures/quotes/I0.shtml?from=wap為了捕捉中國鐵礦石的變化:抓取后,我搜索標簽并找到所有空的' -- '我正在使用:url2 = 'http://finance.sina.com.cn/futures/quotes/I0.shtml?from=wap'html2 = urlopen(url2)bs2 = BeautifulSoup(html2, 'lxml')print(bs2.title)print(bs2.find_all('span', class_ = 'amt'))輸出:<title>鐵礦石2005(I0)期貨行情,新聞,報價_新浪財經_新浪網</title>[<span class="amt">--</span>, <span class="amt">--</span>, <span class="amt">--</span>, <span class="amt">--</span>, <span class="amt">--</span>, <span class="amt">--</span>, <span class="amt">--</span>, <span class="amt">--</span>, <span class="amt">--</span>, <span class="amt">--</span>, <span class="amt">--</span>, <span class="amt">--</span>, <span class="amt">--</span>, <span class="amt">--</span>, <span class="amt">--</span>, <span class="amt">--</span>,.....我已經打開了瀏覽器控制臺,找出網站正在調用的其他頁面,并找到了這兩個:http://hq.sinajs.cn/?_=1584562106303/&list=sz002578,sz002082,sz002167,sz002501,sh600432,sh600255,sz002160,sz002379,sz002428,sh600311,nf_RB2005,nf_I2005,nf_P2005,nf_M2009,nf_Y2005,nf_JD2005,nf_FU2005,nf_BU2006,hf_CAD,hf_CL,hf_GC,hf_SI,hf_S,hf_BO,hf_C,hf_W,hf_AHD,hf_OIL,nf_I0,nf_I2005http://hq.sinajs.cn/?_=1584562106303/&list=nf_I0但沒有什么可以找到資產的變化.....(+ 0.16%)你能幫我解決這個問題嗎?
查看完整描述

2 回答

?
慕婉清6462132

TA貢獻1804條經驗 獲得超2個贊

我認為這是因為當網頁首次加載時,它并沒有真正存在。0.16%

它是由javascript動態生成的,據我所知,無法處理這種情況。BeautifulSoup

您可以在此鏈接中查看與此問題類似的答案


查看完整回答
反對 回復 2022-09-13
?
蝴蝶不菲

TA貢獻1810條經驗 獲得超4個贊

我建議使用硒。它較慢,但它將工作 請參閱硒文檔 https://www.selenium.dev/


查看完整回答
反對 回復 2022-09-13
  • 2 回答
  • 0 關注
  • 104 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號