假設我有這個熊貓系列:num = pd.Series([1,2,3,4,5,6,5,6,4,2,1,3])我想做的是得到一個數字,比如說5,并返回之前發生的索引。因此,如果我使用元素 5,我應該得到 4,因為該元素出現在索引 4 和 6 中?,F在我想為該系列的所有元素執行此操作,并且可以使用for循環輕松完成:for idx,x in enumerate(num): idx_prev = num[num == x].idxmax() if(idx_prev < idx): return idx_prev但是,由于循環,此過程對于較長的串聯長度消耗了太多時間。有沒有辦法以矢量化的形式實現同樣的事情?輸出應如下所示:[NaN,NaN,NaN,NaN,NaN,NaN,4,5,3,1,0,2]
2 回答

揚帆大魚
TA貢獻1799條經驗 獲得超9個贊
您可以使用 來移動索引:groupby
num.index.to_series().groupby(num).shift()
輸出:
0 NaN
1 NaN
2 NaN
3 NaN
4 NaN
5 NaN
6 4.0
7 5.0
8 3.0
9 1.0
10 0.0
11 2.0
dtype: float64

浮云間
TA貢獻1829條經驗 獲得超4個贊
可以在 中繼續工作。numpy
相當于使用是:[num[num == x].idxmax() for idx,x in enumerate(num)]
numpy
_, out = np.unique(num.values, return_inverse=True)
哪個分配
array([0, 1, 2, 3, 4, 5, 4, 5, 3, 1, 0, 2], dtype=int64)
自。現在,您可以將 的壞值分配給 s,如下所示:out
out
Nan
out_series = pd.Series(out) out_series[out >= np.arange(len(out))] = np.nan
添加回答
舉報
0/150
提交
取消