網絡抓取新手,我使用 scrapy 和 python 從特定網站獲取所有類別。包含網絡源(網絡源圖片),我一直在嘗試的代碼如下。我試圖隔離類別,這些類別位于“dropdown-submenu”類中每個項目的 href="/categories#" 之后。我試過了 category_urls = response.css("categories").xpath("@href").extract()category_urls = response.css(".link-list-columns").xpath("@href").extract()但我不斷收到空列。感謝您提供的任何幫助,謝謝!
1 回答

MYYA
TA貢獻1868條經驗 獲得超4個贊
我看不到任何名為“類別”的元素,也沒有看到名為“鏈接列表列”的類,因此我不確定該圖像是否真的是您正在抓取的頁面。(順便說一句,下次請不要發布圖片,要么鏈接頁面,要么復制并粘貼問題中的代碼)
假設打印正確,您可以嘗試:
response.xpath('//li[@class="dropdown-submenu"]/a/@href').getall()
或者等效的 css
response.css('li.dropdown-submenu a::attr(href)').getall()
添加回答
舉報
0/150
提交
取消