我有一個 HTML 響應,我需要獲取<title>頁面上最后一個標簽之間的數據,有沒有辦法可以使用 Python 中的正則表達式或使用 Python 中的其他工具來完成此操作?例如。<title>abc</title><title>def</title>應該返回 def。
2 回答

Smart貓小萌
TA貢獻1911條經驗 獲得超7個贊
您不應該使用正則表達式來解析 HTML,因為大多數情況下效率低下且難以閱讀。如果您沒有任何其他選擇,正則表達式應該是最后的選擇。
值得慶幸的是,有很多適用于 Python 的 HTML 解析器,例如BeautifulSoup。
使用 BeautifulSoup 你可以獲得最后一個標題標簽:
last_title?=?soup.find_all('title')[-1].text.replace('\n',?'')
添加回答
舉報
0/150
提交
取消