亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

提取 HTML 并在 Python 中搜索

提取 HTML 并在 Python 中搜索

一只名叫tom的貓 2023-06-20 17:37:43
我仍然是 python 的初學者,我正在試驗。我正在尋找一種方法來請求一個 url 并獲取網頁的數據,這樣該頁面就不需要打開了。獲得數據后,我需要在數據中搜索標簽,例如,如果它在請求的主頁某處有“hello”。這是一個例子:import urllib.requestfp = urllib.request.urlopen("http://www.python.org")mybytes = fp.read()mystr = mybytes.decode("utf8")fp.close()x = mystr.find('testing word tag');print(x)請耐心等待,因為我還是個菜鳥,找不到我要找的例子。^ 在這里找到了這段代碼,但它似乎無法找到一個字符串。任何人都知道最好的方法嗎?感謝你們 :)
查看完整描述

2 回答

?
慕尼黑8549860

TA貢獻1818條經驗 獲得超11個贊

以下是這類工作最常用的庫:

$?pip?install?requests?bs4

在您最喜歡的 IDE 中:

import requests

from bs4 import BeautifulSoup


r = requests.get("http://www.python.org")

soup = BeautifulSoup(r.content, "html.parser")


sometag = soup.find("sometag")

print(sometag)


查看完整回答
反對 回復 2023-06-20
?
aluckdog

TA貢獻1847條經驗 獲得超7個贊

嘗試這個。


import requests

url = "https://stackoverflow.com/questions/63577634/extract-html-and-search-in-python"


res = requests.get(url)

print(res.text)


查看完整回答
反對 回復 2023-06-20
?
精慕HU

TA貢獻1845條經驗 獲得超8個贊

另一種方法。


from simplified_scrapy import SimplifiedDoc,req

html = req.get('https://www.python.org')

doc = SimplifiedDoc(html)

title = doc.getElement('title').text

print (title)

title = doc.getElementByText('Welcome to', tag='title').text

print (title)

結果:


Welcome to Python.org

Welcome to Python.org

查看完整回答
反對 回復 2023-06-20
  • 2 回答
  • 0 關注
  • 178 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號