例如,Gender 屬性會被轉化為兩個屬性,“Genre=M”和“Genre=F”我需要兩列男性和女性,分配對應于該屬性存在與否的二進制值
2 回答

慕運維8079593
TA貢獻1876條經驗 獲得超5個贊
方法 1:您可以使用 pd.get_dummies(colname) 它將為您提供 n 個新列(其中 n 是該列的不同值的數量),每個列代表二進制標志以表示每行的值狀態。方法二:我們也可以使用df。名稱。map({'M' :0,'F':1}) 方法三:我們可以像df一樣使用replace命令。名稱。replace(['M', 'F' ], [1, 0], inplace=True) 第一種方法是onehot encoding 其他2種類似于標簽編碼

蝴蝶不菲
TA貢獻1810條經驗 獲得超4個贊
使用熊貓功能get_dummies。
get_dummies:將分類變量轉換為虛擬/指標變量。來源。
用法示例:
s = pd.Series(list('abca'))
pd.get_dummies(s)
輸出:
a b c
0 1 0 0
1 0 1 0
2 0 0 1
3 1 0 0
添加回答
舉報
0/150
提交
取消