我的專欄看起來像這樣:df = pd.DataFrame({ 'A':['a','b','a','c','b','d','a'] }) A0 a1 b2 a3 c4 b5 d6 a我需要按字典順序對列進行排序,然后開始熱編碼過程,但我必須將該列的最后一個值作為參考(應映射到全零的向量)并將它們替換為“A”列。喜歡:a = [1 0 0] b = [0 1 0]c = [0 0 1]d = [0 0 0]最終結果應該是這樣的 A0 [1 0 0] 1 [0 1 0]2 [1 0 0] 3 [0 0 1]4 [0 1 0]5 [0 0 0]6 [1 0 0]
1 回答

GCT1015
TA貢獻1827條經驗 獲得超4個贊
嘗試用get_dummies
df['A'] = df.A.str.get_dummies().drop('d', axis=1).to_numpy().tolist()
df
Out[237]:
A
0 [1, 0, 0]
1 [0, 1, 0]
2 [1, 0, 0]
3 [0, 0, 1]
4 [0, 1, 0]
5 [0, 0, 0]
6 [1, 0, 0]
添加回答
舉報
0/150
提交
取消