亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

Python lxml無法獲取所有文本

Python lxml無法獲取所有文本

LEATH 2023-08-08 15:49:03
我正在使用 Pythonlxml庫來解析 HTML。我有葉點,例如<a>,想要獲取其父級的文本。我嘗試通過兩種方式做到這一點:.xpath('::parent*'),.getparent().text.from lxml.etree import HTMLtext = '<p>FIRST PART<a href="THE LINK" target="_blank">LINK TEXT</a>SECOND PART</p>'parsed = HTML(text)parsed.xpath('//a')[0].getparent().textparsed.xpath('//a/parent::*')[0].text我FIRST PART使用了任何一種方法,但是我怎樣才能獲得SECOND PART?
查看完整描述

1 回答

?
叮當貓咪

TA貢獻1776條經驗 獲得超12個贊

您可以使用.itertext()元素的方法:

from lxml.etree import HTML


text = '<p>FIRST PART<a href="THE LINK" target="_blank">LINK TEXT</a>SECOND PART</p>'

parsed = HTML(text)


parent = parsed.xpath('//a/parent::*')[0]

text = list(parent.itertext())

print(text[0])

print(text[-1])

印刷:


FIRST PART

SECOND PART


查看完整回答
反對 回復 2023-08-08
  • 1 回答
  • 0 關注
  • 161 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號