亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

刪除PythonPandas中的所有重復行

刪除PythonPandas中的所有重復行

收到一只叮咚 2019-07-03 16:21:44
刪除PythonPandas中的所有重復行這個pandas drop_duplicates功能是偉大的“獨特”的數據。但是,要傳遞的關鍵字參數之一是take_last=True或take_last=False,而我希望刪除跨列子集重復的所有行。這個是可能的嗎?    A   B   C0   foo 0   A1   foo 1   A2   foo 1   B3   bar 1   A例如,我希望刪除列上匹配的行。A和C因此,這應該刪除行0和1。
查看完整描述

3 回答

?
交互式愛情

TA貢獻1712條經驗 獲得超3個贊

這對熊貓來說要容易得多滴式重復以及保持參數。

import pandas as pd
df = pd.DataFrame({"A":["foo", "foo", "foo", "bar"], "B":[0,1,1,1], "C":["A","A","B","A"]})df.drop_duplicates(subset=['A', 'C'], keep=False)


查看完整回答
反對 回復 2019-07-03
?
Smart貓小萌

TA貢獻1911條經驗 獲得超7個贊

只是想補充一下本的答案滴式重復:

keep{“第一”、“最后”、“假}”、默認“第一”

  • 第一:除去第一次出現的重復。

  • 最后一次:除最后一次事件外,刪除重復項。

  • 假:刪除所有副本。

如此設定keep對于假的,我們給你想要的答案。

如果刪除重復行,則返回DataFrame(*args,*kwargs),可選地只考慮某些列

參數:子集:列標簽或標簽序列,可選只考慮某些列用于識別重復項,默認情況下使用所有列保持:{‘第一’,‘最后’,假},默認‘第一:刪除重復除了第一次出現。最后一次:除最后一次事件外,刪除重復項。假:刪除所有副本。get_lastated inplace:boole,默認為false,無論是刪除重復的還是返回副本cols:kwargs只包含子集的參數[取消推薦的]返回:depliced:dataFrame


查看完整回答
反對 回復 2019-07-03
?
慕勒3428872

TA貢獻1848條經驗 獲得超6個贊

如果希望將結果存儲在另一個數據集中:

df.drop_duplicates(keep=False)

df.drop_duplicates(keep=False, inplace=False)

如果需要更新相同的數據集:

df.drop_duplicates(keep=False, inplace=True)

以上示例將刪除所有重復項并保留一個副本,類似于DISTINCT *在SQL中


查看完整回答
反對 回復 2019-07-03
  • 3 回答
  • 0 關注
  • 2752 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號