亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

python 中分類的相關性

python 中分類的相關性

烙印99 2023-09-05 20:21:46
我有 Python 數據框 df它有多個列Salary  Dept      Approve1500    IT        Yes1200    Finance   No1200    IT        No1300    HR        Yes1800    Finance   No1100    Finance   No1600    Finance   No1500    IT        Yes1200    HR        Yes1500    HR        Yes我想找到薪資/批準和部門/批準之間的關系相關性不起作用,因為有些是分類而不是數字我還有什么其他選擇?如何找到薪資/批準和部門/批準之間的相關性
查看完整描述

1 回答

?
慕虎7371278

TA貢獻1802條經驗 獲得超4個贊

實現此目的的一種方法是將分類變量轉換為虛擬變量,然后計算每個變量的相關性:


dummies = pd.get_dummies(x)

從那里可以輕松計算您喜歡的任何組合之間的相關性:


>>> dummies.corr()

                Salary  Dept_Finance   Dept_HR   Dept_IT  Approve_No  Approve_Yes

Salary        1.000000      0.134865 -0.175072  0.030895   -0.047193     0.047193

Dept_Finance  0.134865      1.000000 -0.534522 -0.534522    0.816497    -0.816497

Dept_HR      -0.175072     -0.534522  1.000000 -0.428571   -0.654654     0.654654

Dept_IT       0.030895     -0.534522 -0.428571  1.000000   -0.218218     0.218218

Approve_No   -0.047193      0.816497 -0.654654 -0.218218    1.000000    -1.000000

Approve_Yes   0.047193     -0.816497  0.654654  0.218218   -1.000000     1.000000

或者一個子集:


>>> dummies[['Salary', 'Dept_HR']].corr()

           Salary   Dept_HR

Salary   1.000000 -0.175072

Dept_HR -0.175072  1.000000


查看完整回答
反對 回復 2023-09-05
  • 1 回答
  • 0 關注
  • 106 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號