已解決430363個問題，去搜搜看，總會有你想問的

Python lxml無法獲取所有文本

首頁猿問 Python lxml無法獲取所有文本

Python lxml無法獲取所有文本

Python

LEATH 2023-08-08 15:49:03

我正在使用 Pythonlxml庫來解析 HTML。我有葉點，例如<a>，想要獲取其父級的文本。我嘗試通過兩種方式做到這一點：.xpath('::parent*'),.getparent().text.from lxml.etree import HTMLtext = '<p>FIRST PART<a href="THE LINK" target="_blank">LINK TEXT</a>SECOND PART</p>'parsed = HTML(text)parsed.xpath('//a')[0].getparent().textparsed.xpath('//a/parent::*')[0].text我FIRST PART使用了任何一種方法，但是我怎樣才能獲得SECOND PART？

查看完整描述

1 回答

叮當貓咪

TA貢獻1776條經驗獲得超12個贊

您可以使用.itertext()元素的方法：

from lxml.etree import HTML

text = '<p>FIRST PART<a href="THE LINK" target="_blank">LINK TEXT</a>SECOND PART</p>'

parsed = HTML(text)

parent = parsed.xpath('//a/parent::*')[0]

text = list(parent.itertext())

print(text[0])

print(text[-1])

印刷：

FIRST PART

SECOND PART

反對回復 2023-08-08

1 回答
0 關注
177 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

Python lxml無法獲取所有文本

Python lxml無法獲取所有文本

1 回答

添加回答