亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

我爬出來的鏈接后綴都是16進制和% ??

craw 790 : https://baike.baidu.com/item/%E5%88%86%E6%94%AF

craw 791 : https://baike.baidu.com/item/%E5%AE%9E%E9%99%85%E5%9B%BD%E6%B0%91%E6%94%B6%E5%85%A5

craw 792 : https://baike.baidu.com/item/1939%E5%B9%B4/10990429

craw 793 : https://baike.baidu.com/item/O%E8%AE%B0%E5%AE%9E%E5%BD%95

craw 794 :

https://baike.baidu.com/item/%E6%B3%A2%E5%A3%AB%E9%A1%BF


類似這樣的

對么?


正在回答

4 回答

控制臺要轉換:?print('craw%d : %s ' % ( count , urllib.parse.unquote(new_url) ))? ? #編碼轉換

流輸出也要轉換:fout.write( '<td>%s</td>' % urllib.parse.unquote( data['url'] ))

1 回復 有任何疑惑可以回復我~

這是漢字的url編碼,可以調用quote()和unquote()互相轉換

1 回復 有任何疑惑可以回復我~

問題+1

0 回復 有任何疑惑可以回復我~

解決了么,我也遇到了一樣的問題

0 回復 有任何疑惑可以回復我~

舉報

0/150
提交
取消
Python開發簡單爬蟲
  • 參與學習       227596    人
  • 解答問題       1288    個

本教程帶您解開python爬蟲這門神奇技術的面紗

進入課程

我爬出來的鏈接后綴都是16進制和% ??

我要回答 關注問題
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號