亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

已解決430363個問題，去搜搜看，總會有你想問的

請問該怎么用python selenium提取網頁中的所有<a>標簽中的超級鏈接地址？

關注

首頁猿問請問該怎么用python...

請問該怎么用python selenium提取網頁中的所有<a>標簽中的超級鏈接地址？

Python 活動 SpringBoot

守著一只汪 2019-09-02 09:05:33

用python selenium提取網頁中的所有<a>標簽中的超級鏈接地址

查看完整描述

3 回答

揚帆大魚

TA貢獻1799條經驗獲得超9個贊

提取所有鏈接應該用循環：

1234	`urls` `=` `driver.find_elements_by_xpath("//a")` `for` `url` `in` `urls:` `print(url.get_attribute("href"))`

如果get_attribute方法報錯應該是沒有找到a標簽對象，如果確定是有的話，可能是頁面加載比較慢還沒加載出來，selenium默認是不會等待對象出現的，需要在找對象前加一些等待時間；另外如果頁面上有iframe的話需要先切換進去才能找到里面的對象。

反對回復 2019-09-07

阿晨1998

TA貢獻2037條經驗獲得超6個贊

解決辦法：
使用selenium.webdriver.remote.webelement.WebElement提供的get_attribute方法。
通過get_attribute拿到該a標簽的各種屬性，通過判斷找到符合要求的元素進行點擊。
get_attribute("href") 得到a標簽對應的目標頁面的URL，對URL進行判斷就可以了解到該頁面是否站內頁面。我們可以知道，如果是站內頁面的話這個屬性一般會是一個相對路徑,或者包含了本站域名，但如果是站外頁面的話，那它一定是包含了“http”的一個url。
get_attribute("target")如果target不是"_blank"的話，可以判斷該頁面是在本窗口跳轉的

反對回復 2019-09-07

3 回答
0 關注
4941 瀏覽

關注

添加回答

舉報

0/150

提交

取消

微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

請問該怎么用python selenium提取網頁中的所有<a>標簽中的超級鏈接地址？

請問該怎么用python selenium提取網頁中的所有<a>標簽中的超級鏈接地址？

3 回答

添加回答

請問該怎么用python selenium提取網頁中的所有<a>標簽中的超級鏈接地址？

請問該怎么用python selenium提取網頁中的所有<a>標簽中的超級鏈接地址？