因为一直在爬今日头条的数据
在下午的时候,爬着爬着就不小心萌发出了刷今日头条文章阅读量的想法,该文章只适合技术交流,并不做商业用途
也许爬过今日头条的战友们都知道,今日头条的_signature 一直不知道怎么获取,当然,我也是苦恼了一阵,但是后面还是把这个_signature这个值是从哪里取得的知晓了,但是,这个值的获取的文件用了7000行代码,算法那一块也是无从下手。emmm...... 扯远了,回归正题吧。
该教程只适合新手,大牛就不用继续往下看了
方法原理很简单,直接用了selenium+webdriver 这两个库
下面贴上代码:
import timeimport requestsfrom selenium import webdriverdef refresh_html(jianshu_url): chromedriver = "C:\Program Files (x86)\Google\chromedriver_win32\chromedriver.exe" browser = webdriver.Chrome(chromedriver) browser.get(jianshu_url) while True: time.sleep(1) browser.refresh()if __name__ == '__main__': url = 'https://www.toutiao.com/i6482646112527188494/' try: refresh_html(url) except: refresh_html(url)
刷之前:
image.png
刷之后:
image.png
注意一点:
今日头条访问次数多的情况下对IP进行验证码验证的情况。
作者:徐代龙
链接:https://www.jianshu.com/p/aa94d777110f
點擊查看更多內容
為 TA 點贊
評論
評論
共同學習,寫下你的評論
評論加載中...
作者其他優質文章
正在加載中
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦