這個網址 https://ihmecovid19storage.blob.core.windows.net/latest/ihme-covid19.zip包含 2 個 csv 文件和 1 個每天更新的 pdf,其中包含 Covid-19 數據。我希望能夠將其Summary_stats_all_locs.csv作為 Pandas DataFrame 加載。通常,如果有指向 csv 的 url,我就可以使用df = pd.read_csv(url),但由于 csv 在 zip 中,我不能在這里這樣做。我該怎么做?謝謝
1 回答
米琪卡哇伊
TA貢獻1998條經驗 獲得超6個贊
您需要先獲取文件,然后使用ZipFile模塊加載它。Pandas 實際上可以從 zip 中讀取 csvs,但這里的問題是有多個,所以我們需要指定文件名。
import requests
import pandas as pd
from zipfile import ZipFile
from io import BytesIO
r = requests.get("https://ihmecovid19storage.blob.core.windows.net/latest/ihme-covid19.zip")
files = ZipFile(BytesIO(r.content))
pd.read_csv(files.open("2020_05_16/Summary_stats_all_locs.csv"))
添加回答
舉報
0/150
提交
取消
