我需要評估 A/B 測試的結果,但在檢查數據時,我注意到兩個對照組都有用戶,我需要刪除它們以免影響測試。我的數據看起來像這樣: transactionId visitorId date revenue group0 906125958 0 2019-08-16 10.8 B1 1832336629 1 2019-08-04 25.9 B2 3698129301 2 2019-08-01 165.7 B3 4214855558 2 2019-08-07 30.5 A4 797272108 3 2019-08-23 100.4 A我需要做的是刪除 A 組和 B 組中的每個用戶,同時保留其余用戶完好無損。因此,從示例數據中我需要以下輸出: transactionId visitorId date revenue group0 906125958 0 2019-08-16 10.8 B1 1832336629 1 2019-08-04 25.9 B4 797272108 3 2019-08-23 100.4 A我嘗試以各種方式做到這一點,但我似乎無法弄清楚,并且在任何地方都找不到答案,我真的很感激這里的一些幫助,提前致謝
1 回答

手掌心
TA貢獻1942條經驗 獲得超3個贊
您可以獲得僅屬于一個組的用戶列表,如下所示:
group_counts = df.groupby('visitorId').agg({'group': 'nunique'}) ##list of users with number of groups
to_include = group_counts[group_counts['group'] == 1] ##filter for just users in 1 group
然后根據該列表中的訪問者過濾原始數據:
df = df[df['visitorId'].isin(to_include.index)]
添加回答
舉報
0/150
提交
取消