亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

有辦法讓輸出的url還是顯示中文嗎

比如這樣子的,http://baike.baidu.com/item/%E9%A6%99%E6%B8%AF%E5%A4%A7%E5%AD%A6/233635

實際上是,https://baike.baidu.com/item/香港大學/23363
5

正在回答

3 回答

quote()可以將漢字轉換為urlencode,unquote對urlencode進行解碼。具體例子如下:

import urllib.parse??

str = "哈哈你好"

print(urllib.parse.quote(str))??

print(urllib.parse.unquote(urllib.parse.quote(str)))


0 回復 有任何疑惑可以回復我~
#1

葬酒為安

結果如下: %E5%93%88%E5%93%88%E4%BD%A0%E5%A5%BD 哈哈你好
2019-03-03 回復 有任何疑惑可以回復我~
def?_get_new_urls(self,?page_url,?soup):
????new_urls?=?set()
????#<a?target="_blank"?href="/item/%E9%98%BF%E5%A7%86%E6%96%AF%E7%89%B9%E4%B8%B9/2259975"?data-lemmaid="2259975">阿姆斯特丹</a>
????#https:?//?baike.baidu.com?/?item?/?阿姆斯特丹?/?2259975
????links?=?soup.find_all('a',href=re.compile(r"/item/(.+?)"))
????for?link?in?links:
????????new_url?=?'/item/'+link.get_text()
????????new_full_url?=?urlparse.urljoin(page_url,new_url)
????????new_urls.add(new_full_url)
????return?new_urls


0 回復 有任何疑惑可以回復我~
#1

趙崇輝

我是這樣寫的,你看下能不能行
2019-01-12 回復 有任何疑惑可以回復我~

這種的在拼接之前是不是就應該將其轉換成中文

0 回復 有任何疑惑可以回復我~

舉報

0/150
提交
取消
Python開發簡單爬蟲
  • 參與學習       227596    人
  • 解答問題       1288    個

本教程帶您解開python爬蟲這門神奇技術的面紗

進入課程

有辦法讓輸出的url還是顯示中文嗎

我要回答 關注問題
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號