亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

pandas groupby 結果使用布爾數組的不同組合作為鍵

pandas groupby 結果使用布爾數組的不同組合作為鍵

回首憶惘然 2023-06-06 10:37:55
我試圖使用布爾數組作為鍵來理解 groupby,這是測試代碼,a = pd.DataFrame([[True,False,False],[False,True,False]], columns=['A','B','C'])print(a)     A      B      C0   True  False  False1  False   True  False然后我嘗試了布爾數組的不同組合,這似乎 groupby 結果都是相同的 rb=a.groupby([False,False])b.apply(pd.DataFrame)       A     B       C0   True    False   False1   False   True    Falsec=a.groupby([True,False])c.apply(pd.DataFrame)      A      B       C0   True    False   False1   False   True    Falsed=a.groupby([False,True])d.apply(pd.DataFrame)     A       B       C0   True    False   False1   False   True    Falsee=a.groupby([False,True])e.apply(pd.DataFrame)     A       B       C0   True    False   False1   False   True    False
查看完整描述

2 回答

?
拉風的咖菲貓

TA貢獻1995條經驗 獲得超2個贊

這是因為您傳遞的分組參數無法將數據幀切成所需的部分。所以它只是復制整個數據框并將其“壓縮”到您傳遞的分組數組中。一個例子 -


a = pd.DataFrame([[True,False,False],[False,True,False]], columns=['A','B','C'])


c = a.groupby([True,False])


print('length of grouper object:',len(c))

print(' ')

print(list(c)[0])

print(' ')

print(list(c)[1])

length of grouper object: 2

 

(False,        A     B      C

1  False  True  False)

 

(True,       A      B      C

0  True  False  False)

請注意,使用分組數組 [False, True],它只是將整個數據幀 a 與每個壓縮在一起。如果您改為傳遞它可以在軸 1 中找到的內容,它將考慮將該系列中的項目用于對數據集進行分組。


另一種看待它的方法是,分組參數需要是一個帶有名稱的系列,并且該名稱應該在數據框的列中找到。如果你傳遞一個數組 [True, False],它基本上被解釋為一個無名系列,因此無法獲得它的鍵來進行拆分。


如果你想了解 groupby 的工作原理,下面是一個很好的圖像 -

http://img1.sycdn.imooc.com//647e9c18000134e505800454.jpg

拆分發生在提供的鍵上,并且該鍵需要在索引/列中可引用,否則它無法拆分并簡單地返回每個組的未拆分數據幀。第一步是石斑魚所做的,接下來是應用和組合步驟,這些步驟很簡單。在您上面看到的元組(打印輸出)中,apply 函數對t[1]每個元組的元素進行操作,然后將其與t[0]每個元組的元素組合并垂直連接。



查看完整回答
反對 回復 2023-06-06
?
慕森王

TA貢獻1777條經驗 獲得超3個贊

讓我們分解一下

.groubpy().apply(pd.DataFrame)正如您在所有變體中使用的那樣,從每個組中獲取行并創建一個數據框,該數據框基本上返回self,因此輸出看起來相同,但 pandas 到達那里的方式在每種情況下都不同

  1. b=a.groupby([False,False]):兩行屬于同一個組(group_id False),一起解析一次形成相同的df

  2. c=a.groupby([True,False]):有兩組,每組一行。Apply 獲取每個組并構建兩個單獨的 DataFrame(每個組一個)。然后連接并返回與原始相同的 df

  3. d=a.groupby([False,True]): 與 #2 相同,但現在第一行屬于 group False。如果您聚合或應用了不同的函數(pandas.DataFrame 除外),您會看到 df 作為True, False索引(默認情況下按 groupby 排序)并且第 1 行將顯示為第一行,因為它屬于組True


查看完整回答
反對 回復 2023-06-06
  • 2 回答
  • 0 關注
  • 168 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號