我經常使用 pd.read_csv() 加載 csv 文件,而且它們通常具有不同數據類型的列。這很好,因為我可以將字典傳遞給 dtype 參數,其中所有列都使用它們各自的數據類型映射出來。我發現的問題是,有時這些 csv 文件有很多列,并且生成的字典非常長。很多時候,字典看起來像這樣:df_dtype = { 'A' : str, 'B' : str, 'C' : int}但是當 df 很長時,字典開始看起來像這樣:df_dtype = { 'A' : str, 'B' : str, 'C' : int, 'D' : str, 'E' : str, 'F' : int, 'G' : str, 'H' : str, 'I' : int, 'J' : str, 'K' : str, 'L' : int, 'M' : str, 'N' : str, 'O' : int, 'P' : str, 'Q' : str, 'R' : int, 'S' : str, 'T' : str, 'U' : int, 'V' : str, 'W' : str, 'X' : int, 'Y' : str, 'Z' : str}這很丑陋,并且使代碼的可讀性降低。這樣做的最佳做法是什么?我應該將字典作為目錄中的單獨文件嗎?有沒有更漂亮的格式化方式?
1 回答

慕的地10843
TA貢獻1785條經驗 獲得超8個贊
一種想法是更改格式以指定 dict 鍵的類型和列表中的列名:
d_types = {str: ['A', 'B', 'D'],
int: ['C','F'],
float: ['G']}
#swap key values in dict
#http://stackoverflow.com/a/31674731/2901002
d = {k: oldk for oldk, oldv in d_types.items() for k in oldv}
print (d)
{'A': <class 'str'>, 'B': <class 'str'>, 'D': <class 'str'>,
'C': <class 'int'>, 'F': <class 'int'>, 'G': <class 'float'>}
添加回答
舉報
0/150
提交
取消