亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何使用 Python 將來自不同公司的多個董事的數據匯總到每個公司使用 Blau

如何使用 Python 將來自不同公司的多個董事的數據匯總到每個公司使用 Blau

慕碼人8056858 2022-01-11 20:13:52
我有一個數據框,其中包含有關幾家公司董事教育背景的分類數據。目前,每家公司(由其股票代碼記錄)都有多個條目,每位董事一個,df 看起來像這樣:Ticker  EducationABC     1ABC     1ABC     5ABC     7ABC     5DEF     3DEF     4DEF     4DEF     4DEF     6我想使用 Blau 指數公式(與 Gini-Simpson 指數相同)創建一個新的數據框,每個公司只有一個條目,如下所示:Ticker  Education DiversityABC     0.64DEF     0.56使用的公式是 (1 - ∑p i 2 ) 其中 p i是 i 個教育類別中每個教育類別的董事比例;例如,對于 ABC 公司,p 1 = 2/5。誰能幫我在 Python (3.7) 中實現這個?任何幫助將不勝感激!
查看完整描述

1 回答

?
眼眸繁星

TA貢獻1873條經驗 獲得超9個贊

您可以嘗試實現自己的def然后使用groupby.apply. 最后,Series.reset_index回到DataFrame格式:


def blaus_index(arr):

    return 1 - sum((arr.value_counts() / len(arr)) ** 2)


df.groupby('Ticker')['Education'].apply(blaus_index).reset_index(name='Education Diversity')


  Ticker  Education Diversity

0    ABC                 0.64

1    DEF                 0.56


查看完整回答
反對 回復 2022-01-11
  • 1 回答
  • 0 關注
  • 220 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號