亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何在python中使用selenium在動態href鏈接上循環?

如何在python中使用selenium在動態href鏈接上循環?

慕神8447489 2022-01-05 13:25:07
我想在動態 href 上循環。事實上,我每頁下載一組文件。在每個頁面上,我下載了 100 個文本文件,但我必須下載 200 000 個文件。所以,我必須在 2000 中點擊 next 按鈕。為此,我得到了 next 按鈕的 href 地址,但不幸的是,此鏈接中的兩個對象發生了變化,頁碼 1,2,3 等和一串人物。請參閱隨附的下一個更改按鈕的示例。https://search.proquest.com/something/E6981FD6D11F45E8PQ/2?accountid=12543#scrollTohttps://search.proquest.com/something/E6981FD6D11F45E8PQ/3?accountid=12543#scrollTohttps://search.proquest.com/something/61C27022597C4092PQ/4?accountid=12543#scrollTohttps://search.proquest.com/something/E431552DC6554BF7PQ/5?accountid=12543#scrollTo我是 Python 的新用戶。我的水平很差。#Before I add selenium setup for scraping. n=2000for i in range(1,n):    href="https://search.proquest.com/something/715376F5A5AF44BBPQ/" + str(i) + "?accountid=12543#scrollTo"    driver.get(href)#Here, I add the code which allows downloading for each page.
查看完整描述

2 回答

?
收到一只叮咚

TA貢獻1821條經驗 獲得超5個贊

示例鏈接對我不可用(我無法注冊)

第一的..

什么是“字符串”?

書號?或類別編號?

如果它只是隨機字符串,我認為您應該找到另一種方法。

使用ActionChain怎么樣?或driver.execute_script()?

首先,在我看來,找到字符串的含義(來自 .js 或 .html)更重要。


查看完整回答
反對 回復 2022-01-05
?
肥皂起泡泡

TA貢獻1829條經驗 獲得超6個贊

我需要幫助來識別下一頁按鈕的 xpath。我的目標是遍歷 Python Selenium 中的頁面。請在此圖片上的 URL 頁面上查看后找到下一頁按鈕的代碼。


檢查后的下一頁按鈕圖片

http://img1.sycdn.imooc.com//61d52bda0001344f17831169.jpg

我嘗試使用 selenium 在 python 中編寫以下代碼以逐頁下載文件。


while True:


scraping()          # here I call my function that allows to download the files per page


try:

    #Checks if there are more pages with links

    next_link = driver.find_element_by_xpath("//*[@title='Page suivante']")

    drive.execute_script("arguments[0].scrollIntoView();", next_link)

    next_link.click()

     #Time sleep

    time.sleep(20)  

except NoSuchElementException:

    pages_rows= False


查看完整回答
反對 回復 2022-01-05
  • 2 回答
  • 0 關注
  • 242 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號