亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

為什么無法使用 BeautifulSoup 找到和提取 br 標簽

為什么無法使用 BeautifulSoup 找到和提取 br 標簽

喵喔喔 2023-05-09 10:40:29
我想在 div 中搜索特定的 br 標簽(每個 div 中的最后一個 br 標簽,如 text3、text6、text9):<li class="odd"> text1 <br>   text2 <br>   text3 <br>    text4</li><li class="odd"> text4  <br>   text5  <br> text6 </li>...<li class="odd"> text7 <br>   text8  <br>  text9  <br>   text10</li>這是我使用的代碼:from bs4 import BeautifulSoupimport requestsURL = '...'content = requests.get(URL)soup = BeautifulSoup(content.text, 'lxml')contentTable  = soup.find_all("li", {"class": "odd"})for li in contentTable:    print(li.text)輸出是這樣的:文本 1 文本 2 文本 3 文本 4 ...文本 9現在我的問題是我不知道如何只提取和找到我想要的 br 標簽。
查看完整描述

1 回答

?
慕俠2389804

TA貢獻1719條經驗 獲得超6個贊

您可以使用stripped_strings而不是text

from bs4 import BeautifulSoup

import requests

URL = '...'

content = requests.get(URL)

soup = BeautifulSoup(content.text, 'lxml')

contentTable? = soup.find_all("li", {"class": "odd"})

for li in contentTable:

? ? li_contents = list(li.stripped_strings)?

? ? print(li_contents)

輸出:


['text1', 'text2', 'text3', 'text4']

['text4', 'text5', 'text6']

['text7', 'text8', 'text9', 'text10']


查看完整回答
反對 回復 2023-05-09
  • 1 回答
  • 0 關注
  • 181 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號