已解決430363個問題，去搜搜看，總會有你想問的

如何使用python獲取<li>和標簽中的每個值

首頁猿問如何使用python獲取<l...

如何使用python獲取<li>和標簽中的每個值

Python

Helenr 2021-07-29 22:11:16

我正在嘗試從網站https://www.cellartracker.com/m/wines/12344 中抓取一些數據。我無法理解如何獲取不屬于標簽中任何類的每個值。以下是我正在尋找的網站代碼：<ul class="twin-set-list"> <li>Vintage 2000</li> <li>Type Red</li> <li>Producer Balnaves of Coonawarra</li> <li>Varietal Cabernet Sauvignon</li> <li>Designation The Tally Reserve</li> <li>Vineyard n/a</li> <li>Country Australia</li> <li>Region South Australia</li> <li>SubRegion Limestone Coast</li> <li>Appellation Coonawarra</li> </ul>像 2000、Red 等值沒有任何類，所以我可以使用什么方式來獲取數據。我在 python 中嘗試了以下代碼（下面僅給出了 html 部分）： from bs4 import BeautifulSouphtml = """<ul class="twin-set-list"> <li>Vintage 2000</li> <li>Type Red</li> <li>Producer Balnaves of Coonawarra</li> <li>Varietal Cabernet Sauvignon</li> <li>Designation The Tally Reserve</li> <li>Vineyard n/a</li> <li>Country Australia</li> <li>Region South Australia</li> <li>SubRegion Limestone Coast</li> <li>Appellation Coonawarra</li> </ul>"""soup = BeautifulSoup(html, 'html.parser')need = {}for li_tag in soup.find_all('ul', {'class':'twin-set-list'}): for span_tag in li_tag.find_all('li'): field = span_tag.find('span').text value = span_tag.find('span').text need[field] = valueprint(need)誰能建議我如何提取這些數據？

查看完整描述

3 回答

狐的傳說

TA貢獻1804條經驗獲得超3個贊

您可以通過以下方式替換您的代碼：

field = span_tag.find('span').text

value = span_tag.text.replace(field,'')

它不是很干凈，但它適用于您的代碼。

反對回復 2021-08-03

慕桂英4014372

TA貢獻1871條經驗獲得超13個贊

您可以遍歷對象的contents屬性bs4：

from bs4 import BeautifulSoup as soup
d = [[getattr(c, 'text', c).strip() for c in i] for i in soup(html, 'html.parser').find_all('li')]

輸出：

[['Vintage', '2000'], ['Type', 'Red'], ['Producer', 'Balnaves of Coonawarra'], ['Varietal', 'Cabernet Sauvignon'], ['Designation', 'The Tally Reserve'], ['Vineyard', 'n/a'], ['Country', 'Australia'], ['Region', 'South Australia'], ['SubRegion', 'Limestone Coast'], ['Appellation', 'Coonawarra']]

反對回復 2021-08-03

一只甜甜圈

TA貢獻1836條經驗獲得超5個贊

也許你可以試試這個：

for li_tag in soup.find_all('ul', {'class':'twin-set-list'}):

for span_tag in li_tag.find_all('li'):

field = span_tag.find('span').text

value = span_tag.text

value = value[len(field)+1:]

need[field] = value

以防萬一，如果您在“值”中有相同的字段，請不要替換它，而是使用 subtring。

反對回復 2021-08-03

3 回答
0 關注
1040 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

如何使用python獲取<li>和<span>標簽中的每個值

如何使用python獲取<li>和<span>標簽中的每個值

3 回答

添加回答

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

如何使用python獲取<li>和<span>標簽中的每個值

如何使用python獲取<li>和<span>標簽中的每個值

3 回答

添加回答