已解決430363個問題，去搜搜看，總會有你想問的

python從請求中獲取url

首頁猿問 python從請求中獲取url

python從請求中獲取url

Python

慕田峪9158850 2022-07-12 18:36:27

我從 django 的 api 獲取數據。數據來自另一個網站的訂單。數據還包括一個 url，例如，example.com但我無法驗證輸入，因為我無權訪問訂單。我得到的網址也可以有不同的種類。更多示例：example.dehttp://example.dewww.example.comhttps://example.dehttp://www.example.dehttps://www.example.de現在我想打開網址以獲取正確的網址。例如，如果我example.com在瀏覽器中打開，我得到了正確的 url http://example.com/，這就是我希望所有 url 的結果。我怎樣才能在python中快速做到這一點？

查看完整描述

1 回答

幕布斯6054654

TA貢獻1876條經驗獲得超7個贊

如果你status_code 200知道你有一個有效的地址。

關于HTTPS://. 如果您不遵循本指南中的答案，您將收到 SSL 錯誤。一旦你有了它，程序就會為你找到正確的 URL。

import requests

import traceback

validProtocols = ["https://www.", "http://www.", "https://", "http://"]

def removeAnyProtocol(url):

url = url.replace("www.","") # to remove any inputs containing just www since we aren't planning on using them regardless.

for protocol in validProtocols:

url = url.replace(protocol, "")

return url

def validateUrl(url):

for protocol in validProtocols:

if(protocol not in url):

pUrl = protocol + removeAnyProtocol(url)

try:

req = requests.head(pUrl, allow_redirects=True)

if req.status_code == 200:

return pUrl

else:

continue

except Exception:

print(traceback.format_exc())

continue

else:

try:

req = requests.head(url, allow_redirects=True)

if req.status_code == 200:

return url

except Exception:

print(traceback.format_exc())

continue

用法：

correctUrl = validateUrl("google.com") # https://www.google.com

反對回復 2022-07-12

1 回答
0 關注
252 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

python從請求中獲取url

python從請求中獲取url

1 回答

添加回答