当前位置:   article > 正文

python数据分析入门之数据类型(菜鸟学习总结篇)_数据形态分类分析python

数据形态分类分析python

前言:好久好久好久没有更新博客了,为了冲击明年的美赛,不得不先暂时放下爬虫的学习,开始学习数据分析,因为之前的两篇文章只是使用open()的方式再配合正则表达的方式进行数据分割后的数据可视化,如果只是想数据可视化,可以参考前面写的文章,但是并没有用到数据分析专用的模块(Pandas),所以那两篇文章,做做图片,那是相当足够了,因为数据是已经经过处理的。也希望我的读者能更我一起进步,陪伴我学习!大家一起冲冲冲!好了,屁话不多说,咱们直接整实际的。


目录

 

一、数据分析的定义及主要工具介绍

数据分析的目的:

数据分析之四剑客:Numpy、Pandas、Matplotlib、Seaborn

二、Pandas的数据类型

Series数据形式及相关参数:

DataFrame数据形式及相关参数:

三、学习思维导图

四:结语


一、数据分析的定义及主要工具介绍

数据分析的目的:

数据分析的目的就是为了找到有用的数据,而使用python进行数据分析的三个优点:方便,高效,第三方库丰富。

数据分析之四剑客:Numpy、Pandas、Matplotlib、Seaborn

NumPy是一个用于数值运算的Python库,专门对数值运算进行优化,最大的优势是快
Pandas是Python最重要的数据分析工具包
Matplotlib和Seaborn是最为常用的数据可视化的工具包,解决如何通过数据来绘制图表,来更好的展示数据。

二、Pandas的数据类型

在数据分析中,我们最多使用到的就是Pandas模块,因此我们需要先了解到它的数据类型:Series和DataFrame

Series数据形式及相关参数:

Series的数据类型以一维数组的形式表现,同时,我们在使用到时需要导入相关的包

  1. # 导入Series,因为Series属于Pandas
  2. from Pandas import Series
  3. # Series的主要常用参数:data(数据,以list的形式),index(行索引,不设置时默认0-N)
  4. # 书写方法一:
  5. ser = Series(data=[1,'TheShy',20,'天不生theshy,LPL上单万古如长夜'],index=[2,4,6,8])
  6. print(ser)
  7. # 输出结果:
  8. #2 1
  9. #4 TheShy
  10. #6 20
  11. #8 天不生theshy,LPL上单万古如长夜
  12. # 书写方法二:(输出结果都一样,就不分别展示了,自己拷贝代码去试试吧)
  13. shuju = [1,'TheShy',20,'天不生theshy,LPL上单万古如长夜']
  14. index=[2,4,6,8]
  15. ser = Series(shuju,index=index)
  16. print(ser)
  17. # 书写方法三:
  18. import Pandas as pd
  19. # 弄数据的方法都有一样,只是直接导入pandas,更加简便
  20. ser = pd.Series(shuju,index=index)

DataFrame数据形式及相关参数:

DataFrame的数据类型以二维数组的形式表现

  1. # 导包
  2. frome Pandas import DataFrame
  3. # 参数介绍:DataFrame 的参数有data(数据),index(行索引),culumns(列索引)
  4. # 书写方式一:
  5. lol_list = [['上单','TheShy',20],
  6. ['打野','小天',19],
  7. ['中单','Faker',23],
  8. ['ADC','Uzi',22],
  9. ['辅助','Ming',21]]
  10. df = DataFrame(data=lol_list,
  11. index=['a','b','c','d','e'],
  12. columns=['位置','ID号','年龄'])
  13. print(df)
  14. # 书写方式二:
  15. # 使用字典创建
  16. dic={
  17. '姓名': ['小罗伯特·唐尼', '克里斯·埃文斯', '斯嘉丽·约翰逊', '克里斯·海姆斯沃斯'],
  18. '饰演': ['钢铁侠', '美国队长', '黑寡妇', '雷神'],
  19. '武器': ['钢铁战衣', '盾牌', '寡妇蜇', '雷神之锤'],
  20. '语录': ['和平,我热爱和平','最好的选择就是重新开始 ','嘿,大兄弟,太阳下山了','要用知识来打败无知']}
  21. df=DataFrame(dic)
  22. print(df)
  23. # 方法三:DataFrame其实就是由多条Series组成的
  24. frome Pandas import DataFrame,Series
  25. import Padas as pd
  26. index_list = ['No1','No2','No3']
  27. dic={
  28. '姓名': Series(['娜娜','淼淼','依依'],index=index_list),
  29. '类型': Series(['可爱单纯','风骚火辣','性感高冷'],index=index_list),
  30. '爱好': Series(['逛街、电影、爱吃甜','喝酒、蹦迪、爱吃辣','看书、烘焙、爱吃酸'],index=index_list),
  31. '时间': Series(['2019-2-14去看电影','2019-2-16去蹦迪','2019-2-18去烘焙'],index=index_list)
  32. }
  33. df = pd.DataFrame(dic)
  34. print(df)

三、学习思维导图

四:结语

编程当然是自己多多实验啦!熟能生巧嘛!希望这篇文章你能喜欢。以后有时间会更新,你的点赞就是对我最大的支持,在这里就先感谢大家了!!!

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/正经夜光杯/article/detail/743780
推荐阅读
相关标签
  

闽ICP备14008679号