已解決430363個問題，去搜搜看，總會有你想問的

試圖抓取網址

首頁猿問試圖抓取網址

試圖抓取網址

Python

皈依舞 2022-11-24 15:17:48

所以我試圖從 Steam 上的免費游戲網站獲取所有網址，但它一直返回空。我不知道我在這里做錯了什么，下圖顯示了路徑result = requests.get("https://steamdb.info/upcoming/free/")src = result.contentsoup = BeautifulSoup(src, 'lxml')urls = []for td_tag in soup.find_all('td'): a_tag = td_tag.find('a') urls.append(a_tag.attrs['href'])print(urls)

查看完整描述

1 回答

BIG陽

TA貢獻1859條經驗獲得超6個贊

您必須使用標頭User-Agent，它不能很短Mozilla/5.0，但是來自真實網絡瀏覽器的完整字符串

import requests

from bs4 import BeautifulSoup

headers = {

"User-Agent":"Mozilla/5.0 (X11; Linux x86_64; rv:78.0) Gecko/20100101 Firefox/78.0",

}

result = requests.get("https://steamdb.info/upcoming/free/", headers=headers)

soup = BeautifulSoup(result.content, 'lxml')

#print(result.content)

urls = []

for td_tag in soup.find_all('td'):

a_tag = td_tag.find('a')

if a_tag:

urls.append(a_tag.attrs['href'])

print(urls)

反對回復 2022-11-24

1 回答
0 關注
115 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

試圖抓取網址

試圖抓取網址

1 回答

添加回答