我有一個帶有特定網址的代碼:url = 'https://www.site.com.br/categoria-produto/category/page/3/? gclid=Cjkdksjkcm35522'last_page = urlif last_page.split("page")[1]: t = last_page.split("page")[1] print(last_page)給我一個清單,然而,取決于 url 看起來的列表可能具有 / 3 / 或 / 23 / 的值,因為我無法知道這兩個欄之間的值,即一個或兩個位置甚至三個位置。我認為的唯一方法是使用正則表達式,但我不知道如何組裝表達式。詳細信息:如果我嘗試獲取打印位置 (last_page [1:4]) 并且兩者之間只有 1 個小數位 // 將獲得條形圖。
1 回答

收到一只叮咚
TA貢獻1821條經驗 獲得超5個贊
如果您只是想獲取頁碼,那么這種模式應該可以解決問題。
url = 'https://www.site.com.br/categoria-produto/category/page/3/?gclid=Cjkdksjkcm35522'
pg_num = re.search(r'page/([0-9]+)/', url).group(1)
# pg_num = '3'
添加回答
舉報
0/150
提交
取消