首頁手記 Python數據類型之集合

Python數據類型之集合

標簽：

Python

导语：

集合就是数学里的集合，没有什么特殊的定义。集合最好的应用是去重。
集合的表示方法是通过一个{}创建或者通过set和frozenset函数转换成集合。

有两个函数可创建集合类型对象：

set()   创建可变集合对象frozenset()  创建不可变集合对象

可变集合创建：

s = {"tom","cat","name","error"}或s = set({"tom","cat","name","error"})

不可变集合创建：

>>> s = [23，3，4，32]>>> d = frozenset(s)     //创建不可变集合d>>> print(d)>>> frozenset({23,3,4,32})

集合特性：

集合是一组无序排序的可哈希hash的值,不重复支持集合关系测试:支持成员关系测试：in , not in支持迭代不支持：索引、元素获取、切片没有特定语法格式，只能通过工厂函数set或者frozenset创建，字符串则直接创建即可。 集合中的元素必须是可迭代对象,所有元素不会重复,不像list列表是可以重复

注：可哈希什么意思？
hash是一种函数映射，称为hash函数，y=hash_func(x)，可hash就是指对于一个对象x有其对应的y。在python内部是通过字典key的hash值来对应内存中的value地址的，所以两个相同hash的key就表示同一个了，而不可hash的对象自然也不能作为字典的key。

集合运算符：

s | t     s和t的并集s & t   s和t的交集s - t     求差集s ^ t   求对称差集  len(s)  集合中项数max(s)  最大值min(s)   最小值

适用于set可变集合常用方法：

s.add(item)        
将item添加到s中。如果item已经在s中，则无任何效果s.remove(item)  
从s中删除item。如果item不是s的成员，则引发KeyError异常s.discard(item)  
从s中删除item。如果item不是s的成员，则无任何效果s.pop()       
随机删除一个s中任意的集合元素，如果有变量接收则会接收到删除到的那个元素s.clear()     
删除s中的所有元素s.copy()     
浅复制s.update(t)将t中的所有元素添加到s中。t可以是另一个集合、一个序列或者支持迭代的任意对象s.union(t)                          求并集。返回所有在s和t中的元素s.intersection(t)                
求交集。返回所有同时在s和t中的都有的元素s.intersection_update(t)   
计算s与t的交集，并将结果放入ss.difference(t)                   
求差集。返回所有在set中，但不在t中的元素s.difference_update(t)      
从s中删除同时也在t中的所有元素s.symmetric_difference(t)  
求对称差集。返回所有s中没有t中的元素和t中没有s中的元素组成的集合s.sysmmetric_difference_update(t) 计算s与t的对称差集，并将结果放入ss.isdisjoint(t)     
如果s和t没有相同项，则返回Trues.issubset(t)      
如果s是t的一个子集，则返回Trues.issuperset(t)   
如果s是t的一个超集，则返回True

集合实例：祛除列表中重复的元素

例1：去除海量列表里重复元素

>>> a = [11,22,33,44,11,22] >>> b = set(a) >>> b set([33, 11, 44, 22])

例2：去除重复元素后转换成列表

l1 = ['b','c','d','b','c','a','a']l2 = list(set(l1))print l2

还有一种据说速度更快的，没测试过两者的速度差别

l1 = ['b','c','d','b','c','a','a']l2 = {}.fromkeys(l1).keys()print l2

这两种都有个缺点，祛除重复元素后排序变了：
['a', 'c', 'b', 'd']

如果想要保持他们原来的排序：

用list类的sort方法l1 = ['b','c','d','b','c','a','a']l2 = list(set(l1))l2.sort(key=l1.index)print l2

也可以这样写：

l1 = ['b','c','d','b','c','a','a']l2 = sorted(set(l1),key=l1.index)print l2

也可以用遍历：

l1 = ['b','c','d','b','c','a','a']l2 = []for i in l1:    if not i in l2:        l2.append(i)print l2

上面的代码也可以这样写

l1 = ['b','c','d','b','c','a','a']l2 = [][l2.append(i) for i in l1 if not i in l2]print l2

这样就可以保证排序不变了：
['b', 'c', 'd', 'a']

點擊查看更多內容

為 TA 點贊

若覺得本文不錯，就分享一下吧！

評論

評論

共同學習，寫下你的評論

評論加載中...

展開查看更多評論

作者其他優質文章

正在加載中

料青山看我應如是

手記
篇

粉絲

98

獲贊與收藏

355

關注作者，訂閱最新文章

閱讀免費教程

Python 辦公自動化教程

17個小節 26775 907

Python 算法入門教程

15個小節 29168 1121

Python 進階應用教程

38個小節 69984 1093

推薦

評論

收藏

共同學習，寫下你的評論



感謝您的支持，我會繼續努力的～

掃碼打賞，你說多少就多少

贊賞金額會直接到老師賬戶

支付方式

打開微信掃一掃，即可進行掃碼打賞哦

今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與放棄機會

點擊
抽獎

慕課手記新用戶專享福利

恭喜你，你的運氣太好了，居然抽中了 100個積分！

恭喜你，抽中了價值元的專欄！

太棒了，直接落到你賬戶里！

積分商城里的羅技鼠標、機械鍵盤、
Kindle 閱讀器、小米平衡車
Apple iPad （10.2英寸）、大額優惠券
在等著你去兌換了噢

作者：

免費贈送

兌換碼：1111222211 復制

優惠券可用于購買實戰課、體系課
無門檻使用

先去看看，有什么好東西馬上兌換我愛學習，選課去


亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空