首頁猿問 pandas groupby...

pandas groupby 結果使用布爾數組的不同組合作為鍵

Python

回首憶惘然 2023-06-06 10:37:55

我試圖使用布爾數組作為鍵來理解 groupby，這是測試代碼，a = pd.DataFrame([[True,False,False],[False,True,False]], columns=['A','B','C'])print(a) A B C0 True False False1 False True False然后我嘗試了布爾數組的不同組合，這似乎 groupby 結果都是相同的 rb=a.groupby([False,False])b.apply(pd.DataFrame) A B C0 True False False1 False True Falsec=a.groupby([True,False])c.apply(pd.DataFrame) A B C0 True False False1 False True Falsed=a.groupby([False,True])d.apply(pd.DataFrame) A B C0 True False False1 False True Falsee=a.groupby([False,True])e.apply(pd.DataFrame) A B C0 True False False1 False True False

查看完整描述

2 回答

拉風的咖菲貓

TA貢獻1995條經驗獲得超2個贊

這是因為您傳遞的分組參數無法將數據幀切成所需的部分。所以它只是復制整個數據框并將其“壓縮”到您傳遞的分組數組中。一個例子 -

a = pd.DataFrame([[True,False,False],[False,True,False]], columns=['A','B','C'])

c = a.groupby([True,False])

print('length of grouper object:',len(c))

print(' ')

print(list(c)[0])

print(' ')

print(list(c)[1])

length of grouper object: 2

(False, A B C

1 False True False)

(True, A B C

0 True False False)

請注意，使用分組數組 [False, True]，它只是將整個數據幀 a 與每個壓縮在一起。如果您改為傳遞它可以在軸 1 中找到的內容，它將考慮將該系列中的項目用于對數據集進行分組。

另一種看待它的方法是，分組參數需要是一個帶有名稱的系列，并且該名稱應該在數據框的列中找到。如果你傳遞一個數組 [True, False]，它基本上被解釋為一個無名系列，因此無法獲得它的鍵來進行拆分。

如果你想了解 groupby 的工作原理，下面是一個很好的圖像 -

拆分發生在提供的鍵上，并且該鍵需要在索引/列中可引用，否則它無法拆分并簡單地返回每個組的未拆分數據幀。第一步是石斑魚所做的，接下來是應用和組合步驟，這些步驟很簡單。在您上面看到的元組（打印輸出）中，apply 函數對t[1]每個元組的元素進行操作，然后將其與t[0]每個元組的元素組合并垂直連接。

反對回復 2023-06-06

慕森王

TA貢獻1777條經驗獲得超3個贊

讓我們分解一下

.groubpy().apply(pd.DataFrame)正如您在所有變體中使用的那樣，從每個組中獲取行并創建一個數據框，該數據框基本上返回self，因此輸出看起來相同，但 pandas 到達那里的方式在每種情況下都不同

b=a.groupby([False,False])：兩行屬于同一個組（group_id False），一起解析一次形成相同的df
c=a.groupby([True,False])：有兩組，每組一行。Apply 獲取每個組并構建兩個單獨的 DataFrame（每個組一個）。然后連接并返回與原始相同的 df
d=a.groupby([False,True]): 與 #2 相同，但現在第一行屬于 group False。如果您聚合或應用了不同的函數（pandas.DataFrame 除外），您會看到 df 作為True, False索引（默認情況下按 groupby 排序）并且第 1 行將顯示為第一行，因為它屬于組True

反對回復 2023-06-06

2 回答
0 關注
168 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

pandas groupby 結果使用布爾數組的不同組合作為鍵

pandas groupby 結果使用布爾數組的不同組合作為鍵

2 回答

添加回答