我有一個與此類似的 Pandas Dataframe|Ind| C1 | C2 |....| Cn ||-----------------------|| 1 |val1| AE |....|time||-----------------------|| 2 |val2| FB |....|time||-----------------------||...|....| .. |....| ...||-----------------------|| n |valn| QK |....|time|我必須按列C2對每個組進行一些過濾,并將結果存儲在每個組的單獨文件中。Grouped Dataframe:Subset 1:|Ind| C1 | C2 |....| Cn ||-----------------------|| 1 |val1| AE |....|time||-----------------------|| 2 |val2| AE |....|time||-----------------------||...|....| .. |....| ...||-----------------------|| n |valn| AE |....|time|Subset 2|Ind| C1 | C2 |....| Cn ||-----------------------|| 1 |val1| FB |....|time||-----------------------|| 2 |val2| FB |....|time||-----------------------||...|....| .. |....| ...||-----------------------|| n |valn| FB |....|time|and so on.我目前的方法看起來與此類似def my_filter_function(self, df): result = df[df["C1"].notna() & df["Cn"] != 'Some value'] pd.to_csv(...)df = pd.read_csv(...)df.groupby("C2").apply(lambda x: self.my_filter_function(x))我現在的問題是 Pandas 在此處、此處和文檔中提到的第一組上調用了兩次 apply 方法。所以第一組的文件將被存儲兩次。有什么辦法可以避免這種情況,或者您對另一種方法有什么建議嗎?是否可以在應用方法之后保留分組?
添加回答
舉報
0/150
提交
取消