df = Name Age CityJack 34 SydneyRiti 30 DelhiAadi 16 New YorkRiti 30 DelhiRiti 30 DelhiRiti 30 MumbaiAadi 40 LondonSachin 30 Delhidf[df.duplicated(keep='last')]上面的代碼給出了重復的列表。但是我需要的是,如果包含至少1個重復項,那么它應該返回。dfThe df contains duplicate rows
2 回答

富國滬深
TA貢獻1790條經驗 獲得超9個贊
您可以使用 :any
>>> df
Name Age City
0 Jack 34 Sydney
1 Riti 30 Delhi
2 Aadi 16 NewYork
3 Riti 30 Delhi
4 Riti 30 Delhi
5 Riti 30 Mumbai
6 Aadi 40 London
7 Sachin 30 Delhi
>>> df.duplicated().any()
True
>>> 'The df contains duplicates' if df.duplicated().any() else 'no duplicates'
'The df contains duplicates'

人到中年有點甜
TA貢獻1895條經驗 獲得超7個贊
duplicated 實際上返回一個 Series,其中包含每行的布爾值。如果該行具有重復項,則返回的序列中的相應行具有“True”值。
因此,您可以執行以下操作:
df.duplicated().any()
如果數據幀中存在任何重復項,它將返回 True。
添加回答
舉報
0/150
提交
取消