当前位置:   article > 正文

数据处理大杀器:Python Collections模块全攻略解析_python 中collections 使用详解

python 中collections 使用详解

在Python中,Collections模块是数据处理中的一把利器,它提供了一些特殊的容器数据类型,如CounterdefaultdictOrderedDict等,能够极大地简化和优化数据处理的任务。本文将深入探讨Collections模块的各种功能和用法,包括每个容器类型的详细解析以及实际应用示例。通过全面了解Collections模块,读者将能够更高效地处理各种数据结构,提升Python编程水平。

Counter:计数器

1.1 简介

Counter是一个简单而强大的工具,用于统计可迭代对象中元素的出现次数。

1.2 示例
1from collections import Counter  
2  
3# 创建Counter对象  
4词频统计 = Counter(['apple', 'banana', 'apple', 'orange', 'apple', 'banana', 'pear'])  
5  
6# 获取元素出现次数  
7print(词频统计['apple'])  # 输出3  

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

defaultdict:默认字典

2.1 简介

defaultdict是一个字典子类,它接受一个工厂函数作为默认值的工具。

2.2 示例
 1from collections import defaultdict  
 2  
 3# 创建defaultdict对象  
 4用户字典 = defaultdict(int)  
 5  
 6# 插入数据  
 7用户字典['Alice'] += 1  
 8用户字典['Bob'] += 2  
 9  
10# 访问不存在的键,使用默认值  
11print(用户字典['Charlie'])  # 输出0
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

OrderedDict:有序字典

3.1 简介

OrderedDict是一个字典子类,它记住了字典元素的添加顺序。

3.2 示例
 1from collections import OrderedDict  
 2  
 3# 创建OrderedDict对象  
 4有序字典 = OrderedDict()  
 5  
 6# 插入数据  
 7有序字典['apple'] = 3  
 8有序字典['banana'] = 2  
 9有序字典['orange'] = 5  
10  
11# 遍历按插入顺序排列的键值对  
12for key, value in 有序字典.items():  
13    print(key, value)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

namedtuple:命名元组

4.1 简介

namedtuple是一个工厂函数,用于创建具有字段名的元组子类。

4.2 示例
 1from collections import namedtuple  
 2  
 3# 创建namedtuple类  
 4Person = namedtuple('Person', ['name', 'age', 'gender'])  
 5  
 6# 创建实例  
 7个人信息 = Person(name='Alice', age=25, gender='Female')  
 8  
 9# 访问字段  
10print(个人信息.name, 个人信息.age, 个人信息.gender)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

deque:双端队列

5.1 简介

deque是一个双向队列,可以从两端快速添加或删除元素。

5.2 示例
 1from collections import deque  
 2  
 3# 创建deque对象  
 4双端队列 = deque([1, 2, 3, 4, 5])  
 5  
 6# 从左端添加元素  
 7双端队列.appendleft(0)  
 8  
 9# 从右端删除元素  
10双端队列.pop()  
11  
12# 遍历元素  
13for 元素 in 双端队列:  
14    print(元素)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14

ChainMap:链式映射

6.1 简介

ChainMap是一个字典的集合,可在它们之间创建一个单一的视图。

6.2 示例
 1from collections import ChainMap  
 2  
 3# 创建ChainMap对象  
 4字典1 = {'a': 1, 'b': 2}  
 5字典2 = {'b': 3, 'c': 4}  
 6  
 7链式映射 = ChainMap(字典1, 字典2)  
 8  
 9# 访问键值  
10print(链式映射['b'])  # 输出2,因为在字典1中'b'的值为2
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

实际应用示例

实际应用:数据分析

在数据分析中,Counter经常用于统计某一列的值的频率。

 1from collections import Counter  
 2  
 3# 假设有一个包含用户喜好的列表  
 4user_likes = ['python', 'java', 'python', 'c++', 'java', 'python', 'java', 'javascript']  
 5  
 6# 使用Counter统计每种语言的喜好次数  
 7language_counter = Counter(user_likes)  
 8  
 9# 打印结果  
10for language, count in language_counter.items():  
11    print(f"{language}: {count}次")
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
实际应用:文本处理

在文本处理中,defaultdictCounter也是非常有用的。例如,统计文本中每个单词的出现次数。

 1from collections import defaultdict, Counter  
 2import re  
 3  
 4text = "Python is a powerful programming language. Python is also easy to learn."  
 5  
 6# 使用defaultdict创建一个单词计数器  
 7word_counter = defaultdict(int)  
 8  
 9# 利用正则表达式分割单词  
10words = re.findall(r'\b\w+\b', text.lower())  
11  
12# 统计单词出现次数  
13for word in words:  
14    word_counter[word] += 1  
15  
16# 使用Counter获取出现频率最高的5个单词  
17top_words = Counter(word_counter).most_common(5)  
18  
19# 打印结果  
20for word, count in top_words:  
21    print(f"{word}: {count}次")
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
实际应用:有序字典

在某些场景中,需要保持字典中元素的插入顺序,这时OrderedDict就派上用场。

 1from collections import OrderedDict  
 2  
 3# 创建有序字典  
 4ordered_dict = OrderedDict()  
 5  
 6# 添加键值对  
 7ordered_dict['a'] = 1  
 8ordered_dict['b'] = 2  
 9ordered_dict['c'] = 3  
10  
11# 遍历按插入顺序排列的键值对  
12for key, value in ordered_dict.items():  
13    print(key, value)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
实际应用:链式映射

在处理配置项时,ChainMap非常有用,它可以将多个字典合并为一个视图。

 1from collections import ChainMap  
 2  
 3# 创建两个字典  
 4config1 = {'debug': True, 'log_level': 'info'}  
 5config2 = {'log_level': 'debug', 'output_file': 'logfile.txt'}  
 6  
 7# 使用ChainMap合并字典  
 8combined_config = ChainMap(config1, config2)  
 9  
10# 访问配置项  
11print(combined_config['debug'])       # 输出True  
12print(combined_config['log_level'])   # 输出info,因为在config1中的值优先  
13print(combined_config['output_file'])  # 输出logfile.txt
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

以上就是“数据处理大杀器:Python Collections模块全攻略解析”的全部内容,希望对你有所帮助。

关于Python技术储备

学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!

一、Python所有方向的学习路线

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

二、Python必备开发工具

img

三、Python视频合集

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

img

四、实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

img

五、Python练习题

检查学习结果。

img

六、面试资料

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

img

最后祝大家天天进步!!

上面这份完整版的Python全套学习资料已经上传至CSDN官方,朋友如果需要可以直接微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/神奇cpp/article/detail/857013
推荐阅读
相关标签
  

闽ICP备14008679号