亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何隔離網絡抓取的分類區域?

如何隔離網絡抓取的分類區域?

慕虎7371278 2023-09-12 10:29:50
網絡抓取新手,我使用 scrapy 和 python 從特定網站獲取所有類別。包含網絡源(網絡源圖片),我一直在嘗試的代碼如下。我試圖隔離類別,這些類別位于“dropdown-submenu”類中每個項目的 href="/categories#" 之后。我試過了 category_urls = response.css("categories").xpath("@href").extract()category_urls = response.css(".link-list-columns").xpath("@href").extract()但我不斷收到空列。感謝您提供的任何幫助,謝謝!
查看完整描述

1 回答

?
MYYA

TA貢獻1868條經驗 獲得超4個贊

我看不到任何名為“類別”的元素,也沒有看到名為“鏈接列表列”的類,因此我不確定該圖像是否真的是您正在抓取的頁面。(順便說一句,下次請不要發布圖片,要么鏈接頁面,要么復制并粘貼問題中的代碼)

假設打印正確,您可以嘗試:

response.xpath('//li[@class="dropdown-submenu"]/a/@href').getall()

或者等效的 css

response.css('li.dropdown-submenu a::attr(href)').getall()


查看完整回答
反對 回復 2023-09-12
  • 1 回答
  • 0 關注
  • 93 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號