亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

在Scrapy中抓取元素之間的文本

在Scrapy中抓取元素之間的文本

米脂 2023-10-06 19:18:48
我正在使用 Scrapy,我正在嘗試抓取這樣的內容:<html>   <div class='hello'>    some elements     .     .     .   </div>   <div class='hi there'>       <div>          <h3> title </h3>          <h4> another title </h4>          <p> some text ..... </p>           "some text without any tag"          <div class='article'>            some elements           .            .          </div>          <div class='article'>            some elements           .            .          </div>          <div class='article'>            some elements           .            .          </div>       </div>     </div></html>如果我想從類名“hi There”的 div 下以及類名“article”的 div 之前的所有元素中提取文本,是否有任何可能的方法使用 XPath 或 CSS 選擇器進行枯萎?
查看完整描述

1 回答

?
倚天杖

TA貢獻1828條經驗 獲得超3個贊

沒用過Scrapy。

不知道它有什么功能,但是

//div[@class='hi there']/div/(div[@class='article'])[1]/preceding-sibling::*

挑選出 div 之前具有“article”類的元素,并且,

//div[@class='hi there']/div/(div[@class='article'])[1]/preceding-sibling::text()

在文章 div 之前為您提供內部文本。


查看完整回答
反對 回復 2023-10-06
  • 1 回答
  • 0 關注
  • 91 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號