已解決430363個問題，去搜搜看，總會有你想問的

如何使用Beautiful Soup提取HTML標記內的特定文本？

首頁猿問如何使用Beautiful...

如何使用Beautiful Soup提取HTML標記內的特定文本？

Python

牛魔王的故事 2021-03-04 14:05:40

我有一個這樣的HTML標記：<ul class="clearfix"> "<li><span class="bold-title">Starts:</span> October 2013</li>"</ul>我想提取“ 2013年10月”。我的代碼是：start_date = articl.find('ul', class_='clearfix').find('li').text.strip()...摘錄為“開始時間：2013年10月”。如何只取日期呢？

查看完整描述

3 回答

catspeake

TA貢獻1111條經驗獲得超0個贊

使用正則表達式：

import re

ss = '''

<li><span class="bold-title">Starts:</span> October 2013</li>"

</ul>

blah blah

<li><<a href="/derives/certificats/"> November 2014 </li>"

</ul>

'''

regx = re.compile('<ul +class="clearfix">.+?'

'<li>.*? *([^<>]+?) *</li>',

re.DOTALL)

print regx.findall(ss)

# prints ['October 2013', 'November 2014']

反對回復 2021-03-26

收到一只叮咚

TA貢獻1821條經驗獲得超5個贊

hold = li.text

for eachTag in li.findAll():

hold = hold.replace(eachTag.text,'')

反對回復 2021-03-26

慕尼黑5688855

TA貢獻1848條經驗獲得超2個贊

使用.contents，它返回一個列表：

>>> from bs4 import BeautifulSoup as BS

>>> html = (stuff above)

>>> soup = BS(html)

>>> print soup.find('li').contents[1].strip()

October 2013

反對回復 2021-03-26

3 回答
0 關注
265 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

如何使用Beautiful Soup提取HTML標記內的特定文本？

如何使用Beautiful Soup提取HTML標記內的特定文本？

3 回答

添加回答

如何使用Beautiful Soup提取HTML標記內的特定文本？

如何使用Beautiful Soup提取HTML標記內的特定文本？