已解決430363個問題，去搜搜看，總會有你想問的

刪除PythonPandas中的所有重復行

首頁猿問刪除PythonPandas中的所...

刪除PythonPandas中的所有重復行

Python

收到一只叮咚 2019-07-03 16:21:44

刪除PythonPandas中的所有重復行這個pandas drop_duplicates功能是偉大的“獨特”的數據。但是，要傳遞的關鍵字參數之一是take_last=True或take_last=False，而我希望刪除跨列子集重復的所有行。這個是可能的嗎？ A B C0 foo 0 A1 foo 1 A2 foo 1 B3 bar 1 A例如，我希望刪除列上匹配的行。A和C因此，這應該刪除行0和1。

查看完整描述

3 回答

交互式愛情

TA貢獻1712條經驗獲得超3個贊

這對熊貓來說要容易得多滴式重復以及保持參數。

import pandas as pd
df = pd.DataFrame({"A":["foo", "foo", "foo", "bar"], "B":[0,1,1,1], "C":["A","A","B","A"]})df.drop_duplicates(subset=['A', 'C'], keep=False)

反對回復 2019-07-03

Smart貓小萌

TA貢獻1911條經驗獲得超7個贊

只是想補充一下本的答案滴式重復:

keep{“第一”、“最后”、“假}”、默認“第一”

第一：除去第一次出現的重復。
最后一次：除最后一次事件外，刪除重復項。
假：刪除所有副本。

如此設定keep對于假的，我們給你想要的答案。

如果刪除重復行，則返回DataFrame(*args，*kwargs)，可選地只考慮某些列
參數：子集：列標簽或標簽序列，可選只考慮某些列用于識別重復項，默認情況下使用所有列保持：{‘第一’，‘最后’，假}，默認‘第一：刪除重復除了第一次出現。最后一次：除最后一次事件外，刪除重復項。假：刪除所有副本。get_lastated inplace：boole，默認為false，無論是刪除重復的還是返回副本cols：kwargs只包含子集的參數[取消推薦的]返回：depliced：dataFrame

反對回復 2019-07-03

慕勒3428872

TA貢獻1848條經驗獲得超6個贊

如果希望將結果存儲在另一個數據集中：

df.drop_duplicates(keep=False)

或

df.drop_duplicates(keep=False, inplace=False)

如果需要更新相同的數據集：

df.drop_duplicates(keep=False, inplace=True)

以上示例將刪除所有重復項并保留一個副本，類似于DISTINCT *在SQL中

反對回復 2019-07-03

3 回答
0 關注
2752 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

刪除PythonPandas中的所有重復行

刪除PythonPandas中的所有重復行

3 回答

添加回答