Python的set是一个无序且无重复元素的集合,概念上相当于数学上的无序集,数据结构上相当于dict的键。
既然set是集合,则必然可以实现并、交、差、对称差等集合运算。
set是一组无序排列的可哈希的值,因此可以用作字典中的键。set和之前介绍的list、tuple、dict等一样,可以使用in操作符检查元素是否在集合中存在,使用len()求得集合元素的个数,使用for循环迭代其成员,使用copy()返回一个浅复制。不同之处在于集合本身无序,所以没有索引,就不能实现索引和切片操作。
相关推荐:《Python视频教程》
set具有以下特性:
·元素不重复出现
·元素必须是不可变对象
你可以把set当作是dict中的键来理解,当然仅仅限于数据结构层面。
在Python中set的底层结构和字典是完全一样的都是哈希表,就当成是只有键没有值的字典就可以了。
Python 早期版本就没有set这个类型,那时候开发者都是直接建一个 {key1:None, key2:None}的字典来实现set的功能。
字典和set都是用空间来换时间,空间浪费很大。
set的最大用途是解决了判断某个元素在集合中出现的查找效率问题。
>>> timeit.timeit(stmt='10**4 in s',setup='s=range(10**5)', number=10**5)
13.447274759909192
>>> timeit.timeit(stmt='10**4 in s',setup='s=set(xrange(10**5))', number=10**5)
0.006686778187940945
>>>
list的实现方式是链表,空间利用率高追加元素快而方便。