1 回答

TA貢獻1802條經驗 獲得超4個贊
實現此目的的一種方法是將分類變量轉換為虛擬變量,然后計算每個變量的相關性:
dummies = pd.get_dummies(x)
從那里可以輕松計算您喜歡的任何組合之間的相關性:
>>> dummies.corr()
Salary Dept_Finance Dept_HR Dept_IT Approve_No Approve_Yes
Salary 1.000000 0.134865 -0.175072 0.030895 -0.047193 0.047193
Dept_Finance 0.134865 1.000000 -0.534522 -0.534522 0.816497 -0.816497
Dept_HR -0.175072 -0.534522 1.000000 -0.428571 -0.654654 0.654654
Dept_IT 0.030895 -0.534522 -0.428571 1.000000 -0.218218 0.218218
Approve_No -0.047193 0.816497 -0.654654 -0.218218 1.000000 -1.000000
Approve_Yes 0.047193 -0.816497 0.654654 0.218218 -1.000000 1.000000
或者一個子集:
>>> dummies[['Salary', 'Dept_HR']].corr()
Salary Dept_HR
Salary 1.000000 -0.175072
Dept_HR -0.175072 1.000000
添加回答
舉報