亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

使用正則表達式刪除部分網址

使用正則表達式刪除部分網址

慕碼人2483693 2023-03-16 15:56:56
這是網址:url = "www.face.com/me/4000517004580.html?gps-id=5547572&scm=1007.19201.130907.0&scm_id=1007.19201.130907.0&scm-url=1007.19201.130907.0&pvid=56aacc48-cc78-4cb9-b176-c9acb7a0662c"我需要刪除.html之后的部分,所以它變成:"www.face.com/me/4000517004580.html"
查看完整描述

4 回答

?
青春有我

TA貢獻1784條經驗 獲得超8個贊

您可以使用 python 的urllib將 url 解析為多個部分,然后從 url 中刪除查詢字符串

from urllib.parse import urlparse

url = "www.face.com/me/4000517004580.html?gps-id=5547572&scm=1007.19201.130907.0&scm_id=1007.19201.130907.0&scm-url=1007.19201.130907.0&pvid=56aacc48-cc78-4cb9-b176-c9acb7a0662c"


parse_result = urlparse(url)

url = parse_result._replace(query="").geturl()  # Remove query from url


查看完整回答
反對 回復 2023-03-16
?
慕虎7371278

TA貢獻1802條經驗 獲得超4個贊

嘗試:

url.split('.html')[0]+'.html'

結果:

'www.face.com/me/4000517004580.html'


查看完整回答
反對 回復 2023-03-16
?
當年話下

TA貢獻1890條經驗 獲得超9個贊

內置urllib庫可以在這里使用。


from urllib.parse import urljoin, urlparse


url = 'www.face.com/me/4000517004580.html?gps-id=5547572&scm=1007.19201.130907.0&scm_id=1007.19201.130907.0&scm-url=1007.19201.130907.0&pvid=56aacc48-cc78-4cb9-b176-c9acb7a0662c' 

output = urljoin(url, urlparse(url).path) 


查看完整回答
反對 回復 2023-03-16
?
侃侃無極

TA貢獻2051條經驗 獲得超10個贊

當您不確定如何解決問題時,我建議您從一些文檔開始。例如,您可以查看字符串方法常用字符串操作。

滾動瀏覽此列表,您將了解該find()功能:

返回在切片 s[start:end] 中找到子字符串 sub 的字符串中的最低索引??蛇x參數 start 和 end 被解釋為切片符號。如果未找到 sub,則返回 -1。

所以要找到"?"你可以這樣做:

i = url.find("?")

與其考慮如何刪除部分字符串,不如考慮如何保留我們想要的部分。我們可以用切片來做到這一點:

url = url[:i]


查看完整回答
反對 回復 2023-03-16
  • 4 回答
  • 0 關注
  • 128 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號