已解決430363個問題，去搜搜看，總會有你想問的

提取 HTML 并在 Python 中搜索

首頁猿問提取 HTML 并在 Python...

提取 HTML 并在 Python 中搜索

Python

一只名叫tom的貓 2023-06-20 17:37:43

我仍然是 python 的初學者，我正在試驗。我正在尋找一種方法來請求一個 url 并獲取網頁的數據，這樣該頁面就不需要打開了。獲得數據后，我需要在數據中搜索標簽，例如，如果它在請求的主頁某處有“hello”。這是一個例子：import urllib.requestfp = urllib.request.urlopen("http://www.python.org")mybytes = fp.read()mystr = mybytes.decode("utf8")fp.close()x = mystr.find('testing word tag');print(x)請耐心等待，因為我還是個菜鳥，找不到我要找的例子。^ 在這里找到了這段代碼，但它似乎無法找到一個字符串。任何人都知道最好的方法嗎？感謝你們：）

查看完整描述

2 回答

慕尼黑8549860

TA貢獻1818條經驗獲得超11個贊

以下是這類工作最常用的庫：

$?pip?install?requests?bs4

在您最喜歡的 IDE 中：

import requests

from bs4 import BeautifulSoup

r = requests.get("http://www.python.org")

soup = BeautifulSoup(r.content, "html.parser")

sometag = soup.find("sometag")

print(sometag)

反對回復 2023-06-20

aluckdog

TA貢獻1847條經驗獲得超7個贊

嘗試這個。

import requests

url = "https://stackoverflow.com/questions/63577634/extract-html-and-search-in-python"

res = requests.get(url)

print(res.text)

反對回復 2023-06-20

精慕HU

TA貢獻1845條經驗獲得超8個贊

另一種方法。

from simplified_scrapy import SimplifiedDoc,req

html = req.get('https://www.python.org')

doc = SimplifiedDoc(html)

title = doc.getElement('title').text

print (title)

title = doc.getElementByText('Welcome to', tag='title').text

print (title)

結果：

Welcome to Python.org

反對回復 2023-06-20

2 回答
0 關注
197 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

提取 HTML 并在 Python 中搜索

提取 HTML 并在 Python 中搜索

2 回答

添加回答