亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

使用 Python 計算所有分類變量的值

使用 Python 計算所有分類變量的值

郎朗坤 2022-05-24 17:14:13
我有一個包含大量列的數據集,如何計算 Python 中所有分類變量的值的頻率?我不想要一兩個特定列的頻率,而是我需要所有變量的頻率type="category"。
查看完整描述

2 回答

?
有只小跳蛙

TA貢獻1824條經驗 獲得超8個贊

使用selected_dtypes()選擇帶有 的列type=category,并使用sum()方法計算頻率:


df.select_dtypes(include='category').sum()

輸出:


col_cat1     9

col_cat2    21


查看完整回答
反對 回復 2022-05-24
?
叮當貓咪

TA貢獻1776條經驗 獲得超12個贊

不完全確定我明白你的意思,但如果你只是想保持頻率的連續計數,字典是一個很好的方法。


例如,如果我們使用虛擬數據 ['A', 'A', 'B', 'A', 'C', 'C']


category_counts = {}


for category in categories:

    try:

        category_counts[category] += 1

    except:

        category_counts[category] = 1

打?。悇e計數)


返回:


{'A':3,'B':1,'C':2}


編輯:因此,如果您想要計算每列的類別,則代碼僅會稍微更改為:


table = [['Male/Female','M','M','F','M',"F"],['Age','10-20','30-40','10-20','20-30','10-20']]


category_counts = {}


for column in table:

    category_counts[column[0]] = {}

    for data in column[1:]:

        try:

            category_counts[column[0]][data] += 1

        except:

            category_counts[column[0]][data] = 1


print(category_counts)

哪個打?。?/p>


{'男/女':{'M':3,'F':2},'年齡':{'10-20':3,'30-40':1,'20-30':1} }


但我不確定您當前如何存儲數據


查看完整回答
反對 回復 2022-05-24
  • 2 回答
  • 0 關注
  • 203 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號