2 回答

TA貢獻1898條經驗 獲得超8個贊
我認為您真正的問題是如何將所有文件放入數據框中
使用標準庫的一部分pathlib來處理您的文件。
Python 3 的 pathlib 模塊:馴服文件系統
由于您的csv文件是相同的,正如您在問題中所述,將它們全部組合到一個數據幀中然后一次清理所有數據會更有效。
單獨清理每個數據幀然后將它們組合起來效率較低
獲取單個組合數據框
from pathlib import Path
import pandas as pd
p = Path(r'c:\some_path_to_files') # set your path
files = p.glob('nba*.csv') # find your files
# It was stated, all the files are the same format, so create one dataframe
df = pd.concat([pd.read_csv(file) for file in files])
[pd.read_csv(file) for file in files]是一個列表推導,它為每個文件創建一個數據框。
pd.concat合并列表中的所有文件
要獲取單獨的數據框:
創建一個dict數據框
每個key都是dict一個文件名
p = Path(r'c:\some_path_to_files') # set your path
files = p.glob('nba*.csv') # find your files
df_dict = dict()
for file in files:
df_dict[file.stem] = pd.read_csv(file)
使用df_dict:
df_dict.keys() # to show you all the keys
df_dict[filename] # to access a specific dataframe
# after cleaning the individual dataframes in df_dict, they can be combined
df_final = pd.concat([value for value in df_dict.values()])
添加回答
舉報