亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

在包含數組的python列表中查找重復項

在包含數組的python列表中查找重復項

富國滬深 2022-11-18 20:46:06
我有一個名為 python 的列表added,它包含 156 個單獨的列表,其中包含兩個 cols 引用和一個數組。示例如下:[0, 1, array]問題是我有重復項,盡管它們并不準確,因為列引用將被翻轉。以下兩個將完全相同:[[0, 1, array], [1, 0, array]]我嘗試刪除重復項的方法是對數字進行排序并檢查是否有相同的數字,如果相同則將結果附加到新列表中。兩者都導致了不同的錯誤:for a in range(len(added)):    added[a][0:2] = added[a][0:2].sort()TypeError: can only assign an iterable我還嘗試查看該數組是否在我的空 python 列表中no_dups,如果不在,則附加列引用和數組。:no_dups = []for a in range(len(added)):    if added[a][2] in no_dups:        print('already appended')    else:        no_dups.append(added[a])<input>:2: DeprecationWarning: elementwise comparison failed; this will raise an error in the future.都沒有用。我正在努力思考如何在這里刪除重復項。
查看完整描述

3 回答

?
墨色風雨

TA貢獻1853條經驗 獲得超6個贊

您的第一個錯誤是因為list.sort()就地排序所以它不會返回,因此無法分配。解決方法:


for a in range(len(added)):

    added[a][:2] = sorted(added[a][:2])

然后,您可以獲得唯一索引:


unique, idx = np.unique([a[:2] for a in added], axis=0, return_index=True)


no_dups = [added[i] for i in idx]


len(added)

>>> 156


len(no_dups)

>>> 78


查看完整回答
反對 回復 2022-11-18
?
至尊寶的傳說

TA貢獻1789條經驗 獲得超10個贊

至于TypeError: can only assign an iterable:

added[a][0:2].sort()返回None,因此,您不能將其分配給列表。如果你想要列表,你需要使用sorted()實際返回排序列表的方法:


added[a][0:2] = sorted(added[a][0:2])

至于<input>:2: DeprecationWarning: elementwise comparison failed; this will raise an error in the future.:

這是警告而不是錯誤。盡管如此,這對您不起作用,因為作為警告狀態,您的對象數組沒有明確定義=。因此,當您搜索 時if added[a][2] in no_dups,它無法真正與added[a][2]的元素進行比較no_dups,因為沒有適當地定義相等性。如果它是 numpy 數組,你可以使用:


for a in range(len(added)):

    added[a][0:2] = sorted(added[a][0:2])

no_dups = []

for a in added:

    add_flag = True

    for b in no_dups:

        #to compare lists, compare first two elements using lists and compare array using .all()

        if (a[0:2]==b[0:2]) and ((a[2]==b[2]).all()):

            print('already appended')

            add_flag = False

            break

    if add_flag:

        no_dups.append(a)


len(no_dups):  78

len(added):   156

但是,如果所有數組的長度都相同,則應使用速度明顯更快的 numpy 堆疊


查看完整回答
反對 回復 2022-11-18
?
回首憶惘然

TA貢獻1847條經驗 獲得超11個贊

您可以將整個 added 轉換為一個 numpy 數組,然后對索引進行切片并對其進行排序,然后使用 np.unique 獲取唯一行。


#dummy added in the form [[a,b,array],[a,b,array],...]

added = [np.random.choice(5,2).tolist()+[np.random.randint(10, size=(1,5))] for i in range(156)]


# Convert to numpy

added_np = np.array(added)

vals, idxs = np.unique(np.sort(added_np[:,:2], axis = 1).astype('int'), axis=0, return_index= True)

added_no_duplicate = added_np[idxs].tolist()


查看完整回答
反對 回復 2022-11-18
  • 3 回答
  • 0 關注
  • 238 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號