已解決430363個問題，去搜搜看，總會有你想問的

將使用 BeautifulSoup 檢索到的數據保存到數組中

首頁猿問將使用 BeautifulSoup...

將使用 BeautifulSoup 檢索到的數據保存到數組中

Python

喵喵時光機 2023-05-09 10:39:21

*大家好，我是 BeautifulSoup 的新手，我不太了解如何提取數據。我想提取亞馬遜暢銷書排行榜的前十個標題并將其存儲到一個數組中。我的目標是創建亞馬遜的前 10 名列表，并針對不同的類別一遍又一遍地復制該過程。我只想提取產品的“標題”。這是我的代碼：*from bs4 import BeautifulSoupimport requestsheaders = {'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_2) AppleWebKit/601.3.9 (KHTML, like Gecko) Version/9.0.2 Safari/601.3.9'}url_amazon = "https://www.amazon.co.uk/Best-Sellers-Electronics/zgbs/electronics"response = requests.get(url_amazon, headers = headers)soup = BeautifulSoup(response.content, "lxml")print(soup.prettify())title = soup.find("h1", class_ = "a-size-large a-spacing-medium zg-margin-left-15 a-text-bold").textprint(title)titles = []for item in soup.findAll("div", attrs = {"class" : "a-fixed-left-grid-col a-col-right"}): name = item.find("div", attrs = {"class" : "p13n-sc-truncated"}) if name is not None: titles.append(name.text) else: titles.append("unknown title")print(len(titles))for i in titles: print(i)輸出是：“未知標題”

查看完整描述

1 回答

揚帆大魚

TA貢獻1799條經驗獲得超9個贊

您的第一個問題是該行中的 CSS 類name = item.find("div", attrs={"class": "p13n-sc-truncated"}應該是p13n-sc-truncate. 您的第二個問題是您用來查找項目的類過于具體（對于第一項）。我發現用 class 搜索列表項更有用zg-item-immersion。

如果只想列出前 10 個項目，則可以將[:10]切片說明符添加到主 for 循環中。把它們放在一起，我們得到：

import requests

from bs4 import BeautifulSoup

headers = {

"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_2) AppleWebKit/601.3.9 (KHTML, like Gecko) Version/9.0.2 Safari/601.3.9"

}

url_amazon = (

"https://www.amazon.co.uk/Best-Sellers-Electronics/zgbs/electronics"

)

response = requests.get(url_amazon, headers=headers)

soup = BeautifulSoup(response.content, "lxml")

print(soup.prettify())

title = soup.find(

"h1", class_="a-size-large a-spacing-medium zg-margin-left-15 a-text-bold"

).text

print(title)

titles = []

for item in soup.findAll("li", attrs={"class": "zg-item-immersion"})[:10]:

name = item.find("div", attrs={"class": "p13n-sc-truncate"})

if name is not None:

titles.append(name.text.strip())

else:

titles.append("unknown title")

print(len(titles))

for i in titles:

print(i)

我用來name.text.strip()刪除換行符和多余的空格。

需要注意的是，這個腳本比較脆弱，因為亞馬遜可以隨時更改布局和類名。

反對回復 2023-05-09

1 回答
0 關注
168 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

將使用 BeautifulSoup 檢索到的數據保存到數組中

將使用 BeautifulSoup 檢索到的數據保存到數組中

1 回答

添加回答