亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

客戶端直接顯示id不是一種好方案,譬如/article/2,這樣的話,爬蟲從1-10000就可以爬取所有文章,應該hash一下

客戶端直接顯示id不是一種好方案,譬如/article/2,這樣的話,爬蟲從1-10000就可以爬取所有文章,應該hash一下

PHP
侃侃爾雅 2019-03-14 13:32:25
一般用什么hash方案呢?md5嘛
查看完整描述

14 回答

?
哆啦的時光機

TA貢獻1779條經驗 獲得超6個贊

只要公開的都有辦法爬,包括含登陸驗證的

查看完整回答
反對 回復 2019-03-18
?
侃侃無極

TA貢獻2051條經驗 獲得超10個贊

建表的時候處理下

id,hash(隨機字符串就好,6-8位)

id只給內部用,不要返回給前臺,前臺使用hash讀取文章

查看完整回答
反對 回復 2019-03-18
?
慕森卡

TA貢獻1806條經驗 獲得超8個贊

基本想要爬你的話,你怎么hash都沒用。

查看完整回答
反對 回復 2019-03-18
?
開心每一天1111

TA貢獻1836條經驗 獲得超13個贊

hash ,你哪里看的文章亂寫的啊 -_-

hash 之后,你自己都無法知道原來的 id 是什么啦。

如果要非可預測性的主鍵,成熟方案是使用 uuid

當然,你不怕麻煩,專門拿一列存一個 showId ,它是“非可預測值”(這個值可以是 id 的 hash ,加 salt)。

查看完整回答
反對 回復 2019-03-18
?
一只萌萌小番薯

TA貢獻1795條經驗 獲得超7個贊

設置不規則ID,只能增加爬蟲難度,沒辦法杜絕。
爬蟲會從上級列表頁面獲取文章連接。所以說這個問題基本杜絕不了

查看完整回答
反對 回復 2019-03-18
?
慕尼黑5688855

TA貢獻1848條經驗 獲得超2個贊

你經過一番折騰后找到了方案,比如hash了下,那么用戶從列表頁點進來是hash過的鏈接,難道爬蟲就不能從列表頁進來?

查看完整回答
反對 回復 2019-03-18
?
烙印99

TA貢獻1829條經驗 獲得超13個贊

不需要的,你能想到的,爬蟲都想到了。你想不到的,可能爬蟲也想到了。。。

查看完整回答
反對 回復 2019-03-18
?
慕工程0101907

TA貢獻1887條經驗 獲得超5個贊

如果ID是連續的,惡意用戶的扒取工作就非常容易做了,直接按照順序下載指定URL即可;如果是訂單號就更危險了,競對可以直接知道我們一天的單量。所以在一些應用場景下,會需要ID無規則、不規則。

查看完整回答
反對 回復 2019-03-18
?
慕姐4208626

TA貢獻1852條經驗 獲得超7個贊

沒什么用的,你在id上做手腳就像是你在隊伍中不斷的換個帽子,別人還是能從隊伍找到你,一般都是在頁面上做功夫,比如簡單的有源碼混淆,前臺用戶看不出來,但是采集用的有頭無頭瀏覽器都是得到的源碼,這樣就提升了難度.只有難度大于收益,才能讓爬蟲放手.誰也不喜歡得不償失.

查看完整回答
反對 回復 2019-03-18
?
慕的地8271018

TA貢獻1796條經驗 獲得超4個贊

把請求區分開來,也就是將請求分為有效請求和無效請求

查看完整回答
反對 回復 2019-03-18
  • 14 回答
  • 0 關注
  • 508 瀏覽

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號