我想使用 .xlsx 文件,我嘗試了內置函數open()和 pandaspd.read_excel()函數,這兩種函數都有效,但我每次都必須將它們包含在構建中,并且重新導入大型數據文件需要很長時間。我更熟悉 SAS,您可以在其中將文件提交到 WORK 庫,是否有與 Python 類似的東西,也許是我可以使用的包?
1 回答

qq_花開花謝_0
TA貢獻1835條經驗 獲得超7個贊
您基本上有 2 個選項來序列化數據并將其存儲在文件中
pickle文件:每個文件一個數據幀
df = pd.read_pickle('data.pkl')
df.to_pickle('data.pkl')
hdf5文件:每個文件有多個數據幀
df = pd.read_hdf('data.h5', 'myframe')
df.to_hdf('data.h5', 'myframe')
這兩種方法都比使用“xlsx”文件快得多,使用更少的磁盤空間并保留您的對象結構和數據類型。我猜 hdf5 更像是您對“庫”的想法。
添加回答
舉報
0/150
提交
取消