我有一個要查詢的數據框,我只想從特定列中獲取唯一值。我試圖執行此代碼: database = pd.read_csv(db_file, sep='\t')
query = database.loc[database[db_specifications[0]].isin(elements)].drop_duplicates(subset=db_specification[1])db_specification只是一個包含我查詢的兩列的列表。有些值是NaN,我不想將它們視為彼此重復,我該如何實現?
1 回答

嚕嚕噠
TA貢獻1784條經驗 獲得超7個贊
您可以先選擇全部NaN
,然后將副本放在數據框的其余部分。
mask = data.isna().any() data = pd.concat([data[mask], data[~mask]])
添加回答
舉報
0/150
提交
取消