已解決430363個問題，去搜搜看，總會有你想問的

ID 不同時的網頁抓取產品

首頁猿問 ID 不同時的網頁抓取產品

ID 不同時的網頁抓取產品

Python

慕勒3428872 2022-09-13 17:41:01

我正在關注YT上的一些視頻，以了解有關Web抓取的一些知識。我無法找到的一件事是，當所有ID都不同時，我該如何拉取項目？soup_findAll(#,{#,:#})目前，我正在從中提取監視器信息，當我檢查元素時，id 是、等，但類適用于所有元素。我如何將所有 ID 都拉入，而不必單獨拉取每個 ID？MicroCenterpwrapper_0pwrapper_1product_wrapper以下是我到目前為止的代碼：from urllib.request import urlopen as uReqfrom bs4 import BeautifulSoup as soupmy_url = 'https://www.microcenter.com/search/search_results.aspx?Ntk=all&sortby=match&N=4294966896+4294821085&myStore=true'# opening up connection, grabbing the pageuClient = uReq(my_url)# stores content into variablepage_html = uClient.read()# closes clientuClient.close()# html parsingpage_soup = soup(page_html, 'html.parser')# grabs each product, hopefullycontainers = page_soup.findAll('id', {'pwrapper_#': 'product_wrapper'})print(len(containers))注意：我知道pwrapper_#在那里，它只是一個#來回答這個問題。謝謝！

查看完整描述

1 回答

慕碼人2483693

TA貢獻1860條經驗獲得超9個贊

**您可以通過僅使用product_wrapper類來選擇所有產品，您也可以使用for loop在這里選擇每個產品，您可以使用兩種方式。**

from urllib.request import urlopen as uReq

from bs4 import BeautifulSoup as soup

my_url = 'https://www.microcenter.com/search/search_results.aspx?Ntk=all&sortby=match&N=4294966896+4294821085&myStore=true'

uClient = uReq(my_url)

page_html = uClient.read()

uClient.close()

page_soup = soup(page_html, 'html.parser')

containers = page_soup.findAll('li', {'class': 'product_wrapper'})

print(len(containers))

for product in containers :

#your code here

#or

#set how many product you want

productNumber = 16

for i in range(0,productNumber,1):

containers = page_soup.findAll('li', {'id': 'product_wrapper'+i})

#your code here

反對回復 2022-09-13

1 回答
0 關注
112 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

ID 不同時的網頁抓取產品

ID 不同時的網頁抓取產品

1 回答

添加回答