亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

beautifulsoup find_all 標題

beautifulsoup find_all 標題

紅糖糍粑 2023-10-18 20:52:28
html 是<div class="trn-defstat__value">    <img src="https://trackercdn.com/rainbow6-ubi/assets/images/badge-ash.16913d82e3.png" title="ASH" style="height:    35px; padding-right: 8px;">     <img src="https://trackercdn.com/rainbow6-ubi/assets/images/badge-jager.600b2773be.png" title="J?GER"   style="height: 35px; padding-right: 8px;">    <img src="https://trackercdn.com/rainbow6-ubi/assets/images/badge-bandit.385144d970.png" title="BANDIT"     style="height: 35px; padding-right: 8px;"></div>我想獲得每個標題的值。但在此之前,我是這樣寫的from bs4 import BeautifulSoup as bsimport requestsbsURL = "https://r6.tracker.network/profile/pc/Spoit.GODSENT"respinse = requests.get(bsURL)html = bs(respinse.text, 'html.parser')title = html.find_all(class_='trn-defstat__value')[4]print(title)結果-><div class="trn-defstat__value"><img src="https://trackercdn.com/rainbow6-ubi/assets/images/badge-ash.16913d82e3.png" style="height: 35px; padding-right: 8px;" title="ASH"/><img src="https://trackercdn.com/rainbow6-ubi/assets/images/badge-jager.600b2773be.png" style="height: 35px; padding-right: 8px;" title="J?GER"/><img src="https://trackercdn.com/rainbow6-ubi/assets/images/badge-bandit.385144d970.png" style="height: 35px; padding-right: 8px;" title="BANDIT"/></div>我應該怎么辦?
查看完整描述

3 回答

?
慕尼黑的夜晚無繁華

TA貢獻1864條經驗 獲得超6個贊

該腳本將打印<img>“頂級操作員”部分的所有標題:


from bs4 import BeautifulSoup as bs

import requests



bsURL = "https://r6.tracker.network/profile/pc/Spoit.GODSENT"

respinse = requests.get(bsURL)

html = bs(respinse.text, 'html.parser')


# find Top Operators tag

operators = html.find(class_='trn-defstat__name', text='Top Operators')


for img in operators.find_next('div').find_all('img'):

    print(img['title'])

印刷:


ASH

J?GER

BANDIT

或者使用CSS:


for img in html.select('.trn-defstat__name:contains("Top Operators") + * img'):

    print(img['title'])


查看完整回答
反對 回復 2023-10-18
?
忽然笑

TA貢獻1806條經驗 獲得超5個贊

只需使用.get()函數獲取屬性并傳入屬性名稱即可。


pip install html5lib

我建議你使用它,我相信它是一個更好的解析器。


from bs4 import BeautifulSoup as bs 

import requests   

bsURL = "https://r6.tracker.network/profile/pc/Spoit.GODSENT" 


respinse = requests.get(bsURL) 




html = bs(respinse.content, 'html5lib')   



container = html.find("div", class_= "trn-defstat mb0 top-operators")



imgs = container.find_all("img")



for img in imgs:

     print(img.get("title"))

我似乎不明白您想要抓取網站的哪一部分,但請注意有時會先獲取blockhtml 代碼,其中包含您想要抓取的詳細信息:)


查看完整回答
反對 回復 2023-10-18
?
不負相思意

TA貢獻1777條經驗 獲得超10個贊

只需使用.get()函數獲取屬性并傳入屬性名稱即可。


pip install html5lib

我建議你使用它,我相信它是一個更好的解析器。


from bs4 import BeautifulSoup as bs 

import requests   

bsURL = "https://r6.tracker.network/profile/pc/Spoit.GODSENT" 


respinse = requests.get(bsURL) 




html = bs(respinse.content, 'html5lib')   



container = html.find("div", class_= "trn-defstat mb0 top-operators")



imgs = container.find_all("img")



for img in imgs:

     print(img.get("title"))

我似乎不明白您想要抓取網站的哪一部分,但請注意有時會先獲取blockhtml 代碼,其中包含您想要抓取的詳細信息:)


查看完整回答
反對 回復 2023-10-18
  • 3 回答
  • 0 關注
  • 167 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號