我已經根據加載的 CSV 文件構建了一個 DataFrame。數據框大約有 60 行和 7 列。此時DF中的所有對象都是字符串。這是現在的樣子: DF數據框稍后將被送入 DNN,因此我需要 DF 中的每個對象都是元組或列表(我更喜歡元組,但我希望兩種方式都有,以防萬一)。如何拆分字符串中的值,以便將它們制成元組?這是我的代碼:import pandas as pdimport datetimefrom os import listdirfilepaths = [f for f in listdir("C:/Users/user/PycharmProjects/NDVI/data/") if f.endswith('.csv')]df = pd.concat(map(pd.read_csv, filepaths))df_v = pd.DataFrame(columns=['S2T0', 'S3T0', 'S3T1', 'S3T2', 'S3T4', 'S3T5', 'S2VAL'])num_columns = len(df_v.columns)row = 0while row < len(df)-7: temp_data = {'S2T0': [df.iloc[row, 3].replace('[', '').replace(']', '')], 'S3T0': [df.iloc[row+1, 3].replace('[', '').replace(']', '')], 'S3T1': [df.iloc[row+2, 3].replace('[', '').replace(']', '')], 'S3T2': [df.iloc[row+3, 3].replace('[', '').replace(']', '')], 'S3T4': [df.iloc[row+4, 3].replace('[', '').replace(']', '')], 'S3T5': [df.iloc[row+5, 3].replace('[', '').replace(']', '')], 'S2VAL': [df.iloc[row+6, 3].replace('[', '').replace(']', '')]} temp_df = pd.DataFrame(temp_data) row += 7 df_v = df_v.append(temp_df, ignore_index=True)print(df_v.loc[0, 'S2T0']) #I did this to see the structure of one object in the DFdf_v.loc[:, :] = df_v.loc[:, :].apply(split, ", ")print(df_v.loc[0, 'S2T0']) #Was hoping the split will work...我得到這個例外:NameError: name 'split' is not defined (obviously because this is not the proper use of split..)順便說一句:如果您有比我做的更優雅的方法來清除“[”和“]”并構建 df_v - 我會很高興聽到。請注意:由于缺少數據,我的一些對象是“[]”。我需要傳遞空列表\元組或 NULL(都可以)
1 回答

繁星coding
TA貢獻1797條經驗 獲得超4個贊
對于 split 遇到的問題,沒有 split function。字符串有一種拆分方法。您可以做的是傳遞一個 lambda 函數,然后返回將該方法應用于每一行中的字符串的每個結果。
此外,applymap
像下面這樣使用應該可以讓您將函數應用于 DataFrame 中的所有單元格。
df_v = df_v.applymap(lambda x: x.split(", ") if x!="" else [])
添加回答
舉報
0/150
提交
取消