亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

請問該怎么用python selenium提取網頁中的所有<a>標簽中的超級鏈接地址?

請問該怎么用python selenium提取網頁中的所有<a>標簽中的超級鏈接地址?

守著一只汪 2019-09-02 09:05:33
用python selenium提取網頁中的所有<a>標簽中的超級鏈接地址
查看完整描述

3 回答

?
揚帆大魚

TA貢獻1799條經驗 獲得超9個贊

提取所有鏈接應該用循環:

1234urls = driver.find_elements_by_xpath("//a") for url in urls:    print(url.get_attribute("href"))

如果get_attribute方法報錯應該是沒有找到a標簽對象,如果確定是有的話,可能是頁面加載比較慢還沒加載出來,selenium默認是不會等待對象出現的,需要在找對象前加一些等待時間;另外如果頁面上有iframe的話需要先切換進去才能找到里面的對象。


查看完整回答
反對 回復 2019-09-07
?
阿晨1998

TA貢獻2037條經驗 獲得超6個贊

解決辦法:
使用selenium.webdriver.remote.webelement.WebElement提供的get_attribute方法。
通過get_attribute拿到該a標簽的各種屬性,通過判斷找到符合要求的元素進行點擊。
get_attribute("href") 得到a標簽對應的目標頁面的URL,對URL進行判斷就可以了解到該頁面是否站內頁面。我們可以知道,如果是站內頁面的話這個屬性一般會是一個相對路徑,或者包含了本站域名,但如果是站外頁面的話,那它一定是包含了“http”的一個url。
get_attribute("target")如果target不是"_blank"的話,可以判斷該頁面是在本窗口跳轉的

查看完整回答
反對 回復 2019-09-07
  • 3 回答
  • 0 關注
  • 4907 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號