当前位置:   article > 正文

2020年Python数据分析学习笔记之Pandas常用数据结构(六)_series的6个常用属性中ndim的作用

series的6个常用属性中ndim的作用

      Pandas模块是基于Numpy模块的一个开源python模块,它提供了大量标准数据模型和高效操作大型数据集所需的工作,广泛应用于数据快速分析、数据清洗和准备等工作,它的名字来源与“panel data"(面板数据)。在一定程度上,可以把pandas模块看作python版的excel。

       与numpy相比,pandas模块更擅长处理二维数据,其主要有Series 和 DataFrame两种数据结果。

1.  Series常用属性

Series类似于通过numpy模块创建的一维数组,不同的是Series对象不仅包含数值,还包含一组索引,我们可以通过索引来访问数组中的数据。

  • Values:返回Series对象所有元素;
  • index:返回索引;
  • dtype:返回数据类型;
  • shape:返回Series数据形状;
  • ndim:返回对象的维度;
  • drop:删除数据;
  • append:增加数据;
  • size:返回对象的个数。
  1. import pandas as pd
  2. import numpy as np
  3. # 创建一个Series(序列)对象
  4. series1 = pd.Series([2.8,3.01,8.99,8.59,5.18],index = ['a','b','c','d','e'] ) # 更改序列索引
  5. print("series1:",series1)
  6. # 创建一个字典
  7. series2 = pd.Series({'中国':'北京','美国':'纽约','英国':'伦敦','日本':'东京'})
  8. series2.drop('美国', inplace=True) # 删除数据
  9. print("series2:",series2)
  10. print("series2.size:",series2.size)
  11. print("series2[0:2]:",series2[0:2])

运行结果: 


2.  DataFrame常用属性 

DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同类型的值(数值、字符串、布尔值等)。DataFrame既有行索引也有列索引,它可以被看作由Series组成的字典(共同用一个索引)。

DataFrame的创建与索引

  1. import pandas as pd
  2. # 数据的创建
  3. data = {
  4. 'name':['张三','李四','王五','孙二'],
  5. 'sex':['male','female','female','male'],
  6. 'year':[2000,2003,1998,2002],
  7. 'city':['北京','上海','广州','深圳']
  8. }
  9. # 数据的读取
  10. df = pd.DataFrame(data)
  11. print(df)
  12. print()
  13. # 数据的索引
  14. df1 = pd.DataFrame(data,columns = ['name','year','city'])
  15. print(df1)
  16. print()
  17. # 如果传入的数据找不到,就会产生NaN值(空缺值)
  18. df2 = pd.DataFrame(data,columns = ['name','year','city','adress'],
  19. index = ['a','b','c','d']) # 创建时指定列名
  20. print(df2)

运行结果:


  1. import pandas as pd
  2. import numpy as np
  3. # 创建方法一,使用列表进行创建
  4. list1 = [['张三',23,'男'],['李四',25,'女'],['王二',15,'男']]
  5. df1 = pd.DataFrame(list1,columns=['姓名','年龄','性别']) # 返回列标签
  6. print(df1)
  7. # 创建方法二,使用字典进行创建
  8. dict = {'姓名':['张三','李四','王二'],'年龄':[23,25,15],'性别':['男','女','男']}
  9. df2 = pd.DataFrame(dict)
  10. print(df2)
  11. # 创建方法三,使用元组进行创建
  12. array1 = np.array(list1) # 将列表转换为元组
  13. df3 = pd.DataFrame(array1,columns=['姓名','年龄','性别'],index = ['a','b','c'])
  14. print(df3)

运行结果:

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/293597
推荐阅读
相关标签
  

闽ICP备14008679号