index [0, 1, 2, 3, 4, 5]part_1 [4, 5, 6, 4, 8, 4]part_2 [11, 12, 10, 12, 14, 13]new [6, 4, 8, 8, na, na]我是 python 和 pandas 的初學者,尋求支持。在一個簡單的數據框中,我想創建一個新列,為我提供滿足條件的累積總和的最后一行df.part_1.cumsum() > df.part_2例如,對于索引 0 處的新列,我將得到值 6,即 (4+5+6) > 11。謝謝!
1 回答

qq_花開花謝_0
TA貢獻1835條經驗 獲得超7個贊
IIUC 這里有一個NumPy基于方法。這個想法是構建一個上三角矩陣,每行中都有輸入數組的移位版本。通過獲取這些的累積和,并與數據幀的第二列進行比較,我們可以使用argmax第一個索引找到累積序列中的值大于相應索引中的第三數據幀列:
a = df.to_numpy()
cs = np.triu(a[:,1]).cumsum(1)
ix = (cs >= a[:,2,None]).argmax(1)
# array([2, 3, 3, 4, 6, 7, 7, 0], dtype=int64)
df['first_ix'] = a[ix,1,None]
print(df)
index part_1 part_2 first_ix
0 0 4 11 6
1 1 5 12 4
2 2 6 10 4
3 3 4 12 8
4 4 8 14 6
5 5 4 13 8
6 6 6 11 8
7 7 8 10 4
添加回答
舉報
0/150
提交
取消