首頁猿問 pandas：如何計算唯一類別？

pandas：如何計算唯一類別？

Python

慕斯709654 2023-02-15 15:35:19

我有一個數據框df_input = pd.DataFrame( { "col_cate": ['A', 'A', 'B', 'B', 'A', 'A', 'B', 'B'], "target_bool": [True, False, True, False, True, False, True, False] } )我想計算獨特類別的數量。所以我希望輸出是這樣的col_cate, target_bool, cnt'A' , True , 2'A' , False , 2'B' , True , 2'B' , False , 2但是df_input.group_by(["col_cate", "target_bool"]).count()給Empty DataFrameColumns: []Index: [(A, False), (A, True), (B, False), (B, True)]但是dummy在df_input作品中添加一個，比如df_input["dummy"] = 1.如何在不添加虛擬對象的情況下按計數表獲取分組？

查看完整描述

3 回答

慕沐林林

TA貢獻2016條經驗獲得超9個贊

df_input.groupby('col_cate')['target_bool'].value_counts()

col_cate target_bool

A False 2

True 2

B False 2

True 2

然后你可以 reset_index()

反對回復 2023-02-15

胡子哥哥

TA貢獻1825條經驗獲得超6個贊

因為函數GroupBy.count用于計算具有排除缺失值的值，如果存在是必要的，請在 groupby 之后指定列，如果兩列都用于by參數 in groupby：

df = (df_input.groupby(by=["col_cate", "target_bool"])['col_cate']

.count()

.reset_index(name='cnt'))

print (df)

col_cate target_bool cnt

0 A False 2

1 A True 2

2 B False 2

3 B True 2

如果要計算所有列，如果指定兩列，則兩者都是可能的（但這里總是相同的輸出）：

df1 = (df_input.groupby(["col_cate", "target_bool"])[['col_cate','target_bool']]

.count()

.add_suffix('_count')

.reset_index())

print (df1)

col_cate target_bool col_cate_count target_bool_count

0 A False 2 2

1 A True 2 2

2 B False 2 2

3 B True 2 2

或者如果使用 GroupBy.size方法它的工作方式有點不同 - 它計算所有值，不排除丟失，因此不需要指定列：

df = df_input.groupby(["col_cate", "target_bool"]).size().reset_index(name='cnt')

print (df)

col_cate target_bool cnt

0 A False 2

1 A True 2

2 B False 2

3 B True 2

反對回復 2023-02-15

呼喚遠方

TA貢獻1856條經驗獲得超11個贊

也像這樣：

In [54]: df_input.groupby(df_input.columns.tolist()).size().reset_index().\

...: rename(columns={0:'cnt'})

Out[54]:

col_cate target_bool cnt

0 A False 2

1 A True 2

2 B False 2

3 B True 2

反對回復 2023-02-15

3 回答
0 關注
128 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

pandas：如何計算唯一類別？

pandas：如何計算唯一類別？

3 回答

添加回答

pandas：如何計算唯一類別？