亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

Beautiful Soup 從 H2 字段中提取文本

Beautiful Soup 從 H2 字段中提取文本

神不在的星期二 2023-08-15 16:16:44
我試圖了解如何修復一些美麗的湯提取,下面是我正在使用的示例代碼,但現在它回來了---> 66             dista = soup.find('h2', {'class': 'RaceHeader_title_1Yk'}).text     67             dista = dista.split( " " )[-1]     68             horses = soup.findAll('div', {'class': 'Entries_entry_2Xt'})AttributeError: 'NoneType' object has no attribute 'text 下面是我正在使用的代碼以及它正在抓取的內容的示例,理想情況下我試圖獲取“1600”作為輸出 dista = soup.find('h2', {'class': 'RaceHeader_title_1Yk'}).text dista = dista.split( " " )[-1]<h2 class="RaceHeader_title_1Yk"><span class="RaceHeader_titleNumber_uNI">R1</span>"MT SOMERS HONEY MAIDEN 1600""1600"</h2>
查看完整描述

2 回答

?
胡說叔叔

TA貢獻1804條經驗 獲得超8個贊

嘗試這個:


import requests

from bs4 import BeautifulSoup


page = requests.get("https://new.tab.co.nz/extended-form/2020-09-18-m6-r1").text

soup = BeautifulSoup(page, "html.parser")

print(soup.find("h2", {"class": "RaceHeader_title_1Yk"}).text.split()[-1])

輸出1600


要獲取所有馬,請添加以下行:


print([h.text for h in soup.find_all("span", {"class": "EntryHeader_runner_UwW"})])

輸出:


['Danny Green (8) 5 g bay', 'Eisenhower (10) 5 g bay', 'On The Rivet (13) 4 g bay', 'Point Break (11) 4 g brown', 'Magie Noire (7) 4 g bay', 'Mazzoni (12) 7 g bay', 'Miss Oaks (3) 5 m bay', 'Turn Your Eyes (6) 5 m chestnut', 'Repulse (5) 4 m bay', 'Spindleshanks (9) 5 m bay', 'Nifty (1) 6 m chestnut', 'Tennessee Rock (14) 4 m bay', 'Wendy Darling (4) 4 m brown', "Tappy's Lad (2) 3 g brown"]



查看完整回答
反對 回復 2023-08-15
?
溫溫醬

TA貢獻1752條經驗 獲得超4個贊

你可以試試這個:


import requests

from bs4 import BeautifulSoup as bs


# URL to be scrapped

link = "https://new.tab.co.nz/extended-form/2020-09-18-m6-r1"


# Sending a get request to get the content of page

source = requests.get(link).text


# Parsing with help of bs4

soup = bs(source,"html.parser")


# Extracting the specific element from bs4 object

content = soup.find('h2', {'class': 'RaceHeader_title_1Yk'})


# Getting the desired content

result = content.text.split(" ")[-1]


print(result)

輸出


1600


查看完整回答
反對 回復 2023-08-15
  • 2 回答
  • 0 關注
  • 187 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號