当前位置:   article > 正文

精通python100天——第八天:集合_python无序性和互异性给set带来了什么好处

python无序性和互异性给set带来了什么好处

在学习了列表和元组之后,我们再来学习一种容器型的数据类型,它的名字叫集合(set)。说到集合这个词大家一定不会陌生,在数学课本上就有这个概念。通常我们对集合的定义是“把一定范围的、确定的、可以区别的事物当作一个整体来看待”,集合中的各个事物通常称为集合的元素。集合应该满足以下特性:

  • 无序性:一个集合中,每个元素的地位都是相同的,元素之间是无序的。
  • 互异性:一个集合中,任何两个元素都是不相同的,即元素在集合中只能出现一次。
  • 确定性:给定一个集合和一个任意元素,该元素要么属这个集合,要么不属于这个集合,二者必居其一,不允许有模棱两可的情况出现。
    Python中的集合跟数学上的集合是完全一致的,需要强调的是上面所说的无序性和互异性。无序性说明集合中的元素并不像列中的元素那样一个挨着一个,可以通过索引实现随机访问(随机访问指的是给定一个有效的范围,随机抽取出一个数字,然后通过这个数字可以获取到对应的元素),所以Python中的集合肯定不能够支持索引运算。另外,集合的互异性决定了集合中不能有重复元素,这一点也是集合区别于列表的关键,说得更直白一些就是,Python中的集合类型会对其中的元素做去重处理。Python中的集合一定是支持in和not in成员运算的,这样就可以确定一个元素是否属于集合,也就是上面所说的集合的确定性。集合的成员运算在性能上要优于列表的成员运算。

创建集合

集合(set)是一个无序的不重复元素序列。

可以使用大括号 { } 或者 set() 函数创建集合,注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。

创建格式:

parame = {value01,value02,...}
或者
set(value)
  • 1
  • 2
  • 3

例子

>>> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}  # set去重功能
>>> print(basket)
{'apple', 'banana', 'pear', 'orange'}
>>> 'orange' in basket          # 判断元素是否在集合内
True
>>> 'crabgrass' in basket
False
>>>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

利用推导式创建集合,类似列表的推导式,推导式是Python中非常有特色的语法,非常方便

>>> d = {x for x in 'abracadabra' if x not in 'abc'}
>>> d
{'r', 'd'}
>>>
  • 1
  • 2
  • 3
  • 4

集合间的运算

  • - (减号)运算包含在被减集合中,但不包含减集合中的元素
  • | (或号)两个集合的并集
  • & (与号)两个集合的交集
  • ^ (异或) 不同时包含于a和b的元素(交集的补集)
    例子
>>> a = set('abracadabra')
>>> b = set('alacazam')
>>> a
{'r', 'b', 'd', 'a', 'c'}
>>> b
{'l', 'm', 'z', 'a', 'c'}
>>> a - b
{'r', 'b', 'd'}
>>> a | b
{'r', 'l', 'b', 'd', 'm', 'z', 'a', 'c'}
>>> a & b
{'a', 'c'}
>>> a ^ b
{'m', 'r', 'l', 'z', 'b', 'd'}
>>>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

集合的基本操作

1、添加元素

语法格式如下:

s.add( x )
  • 1

将元素 x 添加到集合 s 中,如果元素已存在,则不进行任何操作。

>>> my_set = set(("baidu","jd","tianmao"))
>>> my_set.add("xiaomi")
>>> my_set
{'jd', 'baidu', 'tianmao', 'xiaomi'}
>>>
  • 1
  • 2
  • 3
  • 4
  • 5

还有一个方法,也可以添加元素,且参数可以是列表,元组,字典等,语法格式如下:

s.update( x )
  • 1

x 可以有多个,用逗号分开。
例子

>>> my_set
{'jd', 'baidu', 'tianmao', 'xiaomi'}
>>> my_set.update({"guomei","suning"})
>>> my_set
{'jd', 'baidu', 'tianmao', 'guomei', 'suning', 'xiaomi'}
>>> my_set.update([1,4],[5,6])   #通过列表更新
>>> my_set
{1, 'tianmao', 4, 5, 6, 'jd', 'guomei', 'xiaomi', 'baidu', 'suning'}
>>> my_set.update((6,8))   #通过元组更新
>>> my_set
{1, 'tianmao', 4, 5, 6, 8, 'jd', 'guomei', 'xiaomi', 'baidu', 'suning'}
>>> my_set.update({"name":"xiaofei","age":18})  #通过字典更新,发现只把键值更新到集合中
>>> my_set
{1, 'tianmao', 4, 5, 6, 8, 'name', 'jd', 'guomei', 'age', 'xiaomi', 'baidu', 'suning'}
>>>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

2、移除元素

语法格式如下:

s.remove( x )
  • 1

将元素 x 从集合 s 中移除,如果元素不存在,则会发生错误。

>>> my_set
{1, 'tianmao', 4, 5, 6, 8, 'name', 'jd', 'guomei', 'age', 'xiaomi', 'baidu', 'suning'}
>>> my_set.remove("suning")
>>> my_set
{1, 'tianmao', 4, 5, 6, 8, 'name', 'jd', 'guomei', 'age', 'xiaomi', 'baidu'}
>>> my_set.remove(9)    # 移除不存在的值,会发生错误
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
KeyError: 9
>>>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

此外还有一个方法也是移除集合中的元素,且如果元素不存在,不会发生错误。格式如下所示:

s.discard( x )
  • 1

例子

>>> my_set
{1, 'tianmao', 4, 5, 6, 8, 'name', 'jd', 'guomei', 'age', 'xiaomi', 'baidu'}
>>> my_set.discard("9")
>>>
  • 1
  • 2
  • 3
  • 4

我们也可以设置随机删除集合中的一个元素,语法格式如下:

s.pop() 
  • 1

set 集合的 pop 方法会对集合进行无序的排列,然后将这个无序排列集合的左面第一个元素进行删除。

3、计算集合元素个数

语法格式如下:

len(s)
  • 1

例子

>>> my_set
{5, 6, 8, 'name', 'jd', 'guomei', 'age', 'xiaomi', 'baidu'}
>>> len(my_set)
9
>>>
  • 1
  • 2
  • 3
  • 4
  • 5

4、清空集合

语法格式如下:

s.clear()
  • 1

清空集合内的所有元素

>>> my_set
{5, 6, 8, 'name', 'jd', 'guomei', 'age', 'xiaomi', 'baidu'}
>>> my_set.clear()
>>> my_set
set()
>>>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

5、判断元素是否在集合中存在

语法格式如下:

x in s
  • 1

判断元素 x 是否在集合 s 中,存在返回 True,不存在返回 False。

>>> "suning" in my_set
False
>>> "guomei" in my_set
True
>>>
  • 1
  • 2
  • 3
  • 4
  • 5

集合内置方法

  • add() 为集合添加元素
  • clear() 移除集合中的所有元素
  • copy() 拷贝一个集合
  • difference() 返回多个集合的差集
  • difference_update() 移除集合中的元素,该元素在指定的集合也存在。
  • discard() 删除集合中指定的元素
  • intersection() 返回集合的交集
  • intersection_update() 返回集合的交集。
  • isdisjoint() 判断两个集合是否包含相同的元素,如果没有返回 True,否则返回 False。
  • issubset() 判断指定集合是否为该方法参数集合的子集。
  • issuperset() 判断该方法的参数集合是否为指定集合的子集
  • pop() 随机移除元素
  • remove() 移除指定元素
  • symmetric_difference() 返回两个集合中不重复的元素集合。
  • symmetric_difference_update() 移除当前集合中在另外一个指定集合相同的元素,并将另外一个指定集合中不同的元素插入到当前集合中。
  • union() 返回两个集合的并集
  • update() 给集合添加元素

不可变集合

Python中还有一种不可变类型的集合,名字叫frozenset。set跟frozenset的区别就如同list跟tuple的区别,frozenset由于是不可变类型,能够计算出哈希码,因此它可以作为set中的元素。除了不能添加和删除元素,frozenset在其他方面跟set基本是一样的,下面的代码简单的展示了frozenset的用法。

set1 = frozenset({1, 3, 5, 7})
set2 = frozenset(range(1, 6))
print(set1 & set2)    # frozenset({1, 3, 5})
print(set1 | set2)    # frozenset({1, 2, 3, 4, 5, 7})
print(set1 - set2)    # frozenset({7})
print(set1 < set2)    # False
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/213864?site
推荐阅读
相关标签
  

闽ICP备14008679号