赞
踩
前言:好久好久好久没有更新博客了,为了冲击明年的美赛,不得不先暂时放下爬虫的学习,开始学习数据分析,因为之前的两篇文章只是使用open()的方式再配合正则表达的方式进行数据分割后的数据可视化,如果只是想数据可视化,可以参考前面写的文章,但是并没有用到数据分析专用的模块(Pandas),所以那两篇文章,做做图片,那是相当足够了,因为数据是已经经过处理的。也希望我的读者能更我一起进步,陪伴我学习!大家一起冲冲冲!好了,屁话不多说,咱们直接整实际的。
数据分析之四剑客:Numpy、Pandas、Matplotlib、Seaborn
数据分析的目的就是为了找到有用的数据,而使用python进行数据分析的三个优点:方便,高效,第三方库丰富。
NumPy是一个用于数值运算的Python库,专门对数值运算进行优化,最大的优势是快
Pandas是Python最重要的数据分析工具包
Matplotlib和Seaborn是最为常用的数据可视化的工具包,解决如何通过数据来绘制图表,来更好的展示数据。
在数据分析中,我们最多使用到的就是Pandas模块,因此我们需要先了解到它的数据类型:Series和DataFrame
Series的数据类型以一维数组的形式表现,同时,我们在使用到时需要导入相关的包
- # 导入Series,因为Series属于Pandas
- from Pandas import Series
- # Series的主要常用参数:data(数据,以list的形式),index(行索引,不设置时默认0-N)
- # 书写方法一:
- ser = Series(data=[1,'TheShy',20,'天不生theshy,LPL上单万古如长夜'],index=[2,4,6,8])
- print(ser)
-
- # 输出结果:
- #2 1
- #4 TheShy
- #6 20
- #8 天不生theshy,LPL上单万古如长夜
-
- # 书写方法二:(输出结果都一样,就不分别展示了,自己拷贝代码去试试吧)
- shuju = [1,'TheShy',20,'天不生theshy,LPL上单万古如长夜']
- index=[2,4,6,8]
- ser = Series(shuju,index=index)
- print(ser)
-
-
- # 书写方法三:
- import Pandas as pd
-
- # 弄数据的方法都有一样,只是直接导入pandas,更加简便
-
- ser = pd.Series(shuju,index=index)
DataFrame的数据类型以二维数组的形式表现
- # 导包
- frome Pandas import DataFrame
- # 参数介绍:DataFrame 的参数有data(数据),index(行索引),culumns(列索引)
- # 书写方式一:
- lol_list = [['上单','TheShy',20],
- ['打野','小天',19],
- ['中单','Faker',23],
- ['ADC','Uzi',22],
- ['辅助','Ming',21]]
- df = DataFrame(data=lol_list,
- index=['a','b','c','d','e'],
- columns=['位置','ID号','年龄'])
- print(df)
-
- # 书写方式二:
- # 使用字典创建
- dic={
- '姓名': ['小罗伯特·唐尼', '克里斯·埃文斯', '斯嘉丽·约翰逊', '克里斯·海姆斯沃斯'],
- '饰演': ['钢铁侠', '美国队长', '黑寡妇', '雷神'],
- '武器': ['钢铁战衣', '盾牌', '寡妇蜇', '雷神之锤'],
- '语录': ['和平,我热爱和平','最好的选择就是重新开始 ','嘿,大兄弟,太阳下山了','要用知识来打败无知']}
- df=DataFrame(dic)
- print(df)
-
- # 方法三:DataFrame其实就是由多条Series组成的
- frome Pandas import DataFrame,Series
- import Padas as pd
- index_list = ['No1','No2','No3']
- dic={
- '姓名': Series(['娜娜','淼淼','依依'],index=index_list),
- '类型': Series(['可爱单纯','风骚火辣','性感高冷'],index=index_list),
- '爱好': Series(['逛街、电影、爱吃甜','喝酒、蹦迪、爱吃辣','看书、烘焙、爱吃酸'],index=index_list),
- '时间': Series(['2019-2-14去看电影','2019-2-16去蹦迪','2019-2-18去烘焙'],index=index_list)
- }
- df = pd.DataFrame(dic)
- print(df)
编程当然是自己多多实验啦!熟能生巧嘛!希望这篇文章你能喜欢。以后有时间会更新,你的点赞就是对我最大的支持,在这里就先感谢大家了!!!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。