所以我試圖用python做一個多變量線性回歸。但我不能這樣做,因為我的數據集有大小(2920x1)。我想像這張圖片2那樣拆分列,但我用“;”分隔它們。我該怎么做? 在此處輸入圖像描述 在此處 輸入圖像描述
1 回答

慕尼黑的夜晚無繁華
TA貢獻1864條經驗 獲得超6個贊
如果你有一個 pandas.DataFrame ,其中有一列如下所示:
>>> import pandas as pd
>>> df = pd.DataFrame({'a;b;c;d': ['2;3;1;6', '0;1;4;2', '6;9;6;0']})
>>> print(df)
a;b;c;d
0 2;3;1;6
1 0;1;4;2
2 6;9;6;0
您可以使用pandas.Series.str.split()
并pandas.Series.to_list()
制作一個新的數據框。
代碼如下。
>>> df_adjusted = pd.DataFrame(df.iloc[:, 0].str.split(';').to_list(), columns=df.columns[0].split(';'))
>>> print(df_adjusted)
a b c d
0 2 3 1 6
1 0 1 4 2
2 6 9 6 0
編輯:
要讀取以分號分隔單元格的 CSV 文件,請使用pandas.read_csv()
具有正確填充sep
參數的函數。
>>> df = pd.read_csv('path/to/your/data', sep=';')
添加回答
舉報
0/150
提交
取消