我有一個 tsv 文件,其中包含 100k 條記錄,這些記錄具有順序索引值,index col1 col20 nnn yyy 1 nnn yyy2 nnn yyy3 nnn yyy4 nnn yyy5 nnn yyy.....99999 nnn yyy我需要將索引值修改為隨機 ['0', '1'] 之類的,index col1 col20 nnn yyy 1 nnn yyy1 nnn yyy0 nnn yyy1 nnn yyy0 nnn yyy...........1 nnn yyy
1 回答

LEATH
TA貢獻1936條經驗 獲得超7個贊
DataFrame.set_index搭配使用numpy.random.choice:
df = df.set_index(np.random.choice([0, 1], size=len(df)))
或具有分配索引的類似解決方案:
df.index = np.random.choice([0, 1], size=len(df))
print (df)
col1 col2
1 nnn yyy
0 nnn yyy
1 nnn yyy
1 nnn yyy
0 nnn yyy
0 nnn yyy
1 nnn yyy
添加回答
舉報
0/150
提交
取消