已解決430363個問題，去搜搜看，總會有你想問的

使用正則表達式刪除部分網址

首頁猿問使用正則表達式刪除部分網址

使用正則表達式刪除部分網址

Python

慕碼人2483693 2023-03-16 15:56:56

這是網址：url = "www.face.com/me/4000517004580.html?gps-id=5547572&scm=1007.19201.130907.0&scm_id=1007.19201.130907.0&scm-url=1007.19201.130907.0&pvid=56aacc48-cc78-4cb9-b176-c9acb7a0662c"我需要刪除.html之后的部分，所以它變成："www.face.com/me/4000517004580.html"

查看完整描述

4 回答

青春有我

TA貢獻1784條經驗獲得超8個贊

您可以使用 python 的urllib將 url 解析為多個部分，然后從 url 中刪除查詢字符串

from urllib.parse import urlparse

url = "www.face.com/me/4000517004580.html?gps-id=5547572&scm=1007.19201.130907.0&scm_id=1007.19201.130907.0&scm-url=1007.19201.130907.0&pvid=56aacc48-cc78-4cb9-b176-c9acb7a0662c"

parse_result = urlparse(url)

url = parse_result._replace(query="").geturl() # Remove query from url

反對回復 2023-03-16

慕虎7371278

TA貢獻1802條經驗獲得超4個贊

嘗試：

url.split('.html')[0]+'.html'

結果：

'www.face.com/me/4000517004580.html'

反對回復 2023-03-16

當年話下

TA貢獻1890條經驗獲得超9個贊

內置urllib庫可以在這里使用。

from urllib.parse import urljoin, urlparse

url = 'www.face.com/me/4000517004580.html?gps-id=5547572&scm=1007.19201.130907.0&scm_id=1007.19201.130907.0&scm-url=1007.19201.130907.0&pvid=56aacc48-cc78-4cb9-b176-c9acb7a0662c'

output = urljoin(url, urlparse(url).path)

反對回復 2023-03-16

侃侃無極

TA貢獻2051條經驗獲得超10個贊

當您不確定如何解決問題時，我建議您從一些文檔開始。例如，您可以查看字符串方法和常用字符串操作。

滾動瀏覽此列表，您將了解該find()功能：

返回在切片 s[start:end] 中找到子字符串 sub 的字符串中的最低索引?？蛇x參數 start 和 end 被解釋為切片符號。如果未找到 sub，則返回 -1。

所以要找到"?"你可以這樣做：

i = url.find("?")

與其考慮如何刪除部分字符串，不如考慮如何保留我們想要的部分。我們可以用切片來做到這一點：

url = url[:i]

反對回復 2023-03-16

4 回答
0 關注
134 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

使用正則表達式刪除部分網址

使用正則表達式刪除部分網址

4 回答

添加回答