亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

ID 不同時的網頁抓取產品

ID 不同時的網頁抓取產品

慕勒3428872 2022-09-13 17:41:01
我正在關注YT上的一些視頻,以了解有關Web抓取的一些知識。我無法找到的一件事是,當所有ID都不同時,我該如何拉取項目?soup_findAll(#,{#,:#})目前,我正在從 中提取監視器信息,當我檢查元素時,id 是 、等,但類適用于所有元素。我如何將所有 ID 都拉入,而不必單獨拉取每個 ID?MicroCenterpwrapper_0pwrapper_1product_wrapper以下是我到目前為止的代碼:from urllib.request import urlopen as uReqfrom bs4 import BeautifulSoup as soupmy_url = 'https://www.microcenter.com/search/search_results.aspx?Ntk=all&sortby=match&N=4294966896+4294821085&myStore=true'# opening up connection, grabbing the pageuClient = uReq(my_url)# stores content into variablepage_html = uClient.read()# closes clientuClient.close()# html parsingpage_soup = soup(page_html, 'html.parser')# grabs each product, hopefullycontainers = page_soup.findAll('id', {'pwrapper_#': 'product_wrapper'})print(len(containers))注意:我知道pwrapper_#在那里,它只是一個#來回答這個問題。謝謝!
查看完整描述

1 回答

?
慕碼人2483693

TA貢獻1860條經驗 獲得超9個贊

**您可以通過僅使用product_wrapper類來選擇所有產品,您也可以使用for loop在這里選擇每個產品,您可以使用兩種方式。**


from urllib.request import urlopen as uReq

from bs4 import BeautifulSoup as soup


my_url = 'https://www.microcenter.com/search/search_results.aspx?Ntk=all&sortby=match&N=4294966896+4294821085&myStore=true'


uClient = uReq(my_url)    

page_html = uClient.read()

uClient.close()    


page_soup = soup(page_html, 'html.parser')


containers = page_soup.findAll('li', {'class': 'product_wrapper'})

print(len(containers))


for product in containers :

    #your code here


     #or


#set how many product you want

productNumber = 16

for i in range(0,productNumber,1):

    containers = page_soup.findAll('li', {'id': 'product_wrapper'+i})

    #your code here


查看完整回答
反對 回復 2022-09-13
  • 1 回答
  • 0 關注
  • 112 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號