亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

在兩個不同列上具有兩個條件的數據框

在兩個不同列上具有兩個條件的數據框

慕碼人8056858 2023-03-01 15:59:58
我想根據兩個不同列上的兩個條件過濾數據框。在下面的示例中,我想過濾數據框df以包含行,以便它包含uids,列的值計數val大于 4 大于 2。df = pd.DataFrame({'uid':[1,1,1,2,2,3,3,4,4,4],'iid':[11,12,13,12,13,13,14,14,11,12], 'val':[3,4,5,3,5,4,5,4,3,4]})對于這個數據框,我的輸出應該是 df   uid  iid  val0    1   11    31    1   12    42    1   13    55    3   13    46    3   14    57    4   14    48    4   11    39    4   12    4在這里,我過濾掉了uid2 的行數,因為uid == 2行數val >= 4小于 2。我只想保留值大于 4 的行數大于或等于 2。uidval
查看完整描述

1 回答

?
翻閱古今

TA貢獻1780條經驗 獲得超5個贊

您需要groupby.transform一次sum檢查 val 大于或等于ge4 的位置。并檢查結果是否將ge其用作 df 上的布爾過濾器。


print (df[df['val'].ge(4).groupby(df['uid']).transform(sum).ge(2)])

   uid  iid  val

0    1   11    3

1    1   12    4

2    1   13    5

5    3   13    4

6    3   14    5

7    4   14    4

8    4   11    3

9    4   12    4

編輯:另一種避免方法groupby.transform是對val小于 4 的行和 uidloc列,在其上使用并在2 處獲取 True。然后返回 uid 列以在 df 上創建布爾過濾器。結果相同,而且可能更快。gevalue_countsgemap


df[df['uid'].map(df.loc[df['val'].ge(4), 'uid'].value_counts().ge(2))]


查看完整回答
反對 回復 2023-03-01
  • 1 回答
  • 0 關注
  • 93 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號