赞
踩
DataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表
DataFrame的单元格可以存放数值、字符串等,这和excel表很像,同时DataFrame可以设置列名columns与行名index。
pandas常与numpy一起配合使用,所以通常会一起引用,也就是:
可以直接通过pandas的DataFrame函数进行创建。
其中第一个参数是存放在DataFrame里的数据,第二个参数index
就是之前说的行名,第三个参数columns
是之前说的列名。
其中后两个参数可以使用list输入,但是注意,这个list的长度要和DataFrame的大小匹配,不然会报错。
当然,这两个参数是可选的,你可以选择不设置,而且这两个list是可以一样的
比如只看前2行
比如看后5行。
比如只看后2行。
使用index查看行名,columns查看列名
使用values可以查看DataFrame里的数据值,返回的是一个数组。
比如说查看某一列所有的数据值。
查看某一行所有的数据值
直接字母T,线性代数上线。
使用describe可以对数据根据列进行描述性统计。
使用sum默认对每列求和,sum(1)为对每行求和。
数乘运算使用apply。
乘方运算跟matlab类似,直接使用两个*。
扩充列可以直接像字典一样,列名对应一个list,但是注意list的长度要跟index的长度一致。
还可以使用insert,使用这个方法可以指定把列插入到第几列,其他的列顺延。
使用join可以将两个DataFrame合并,但只根据行列名合并,并且以作用的那个DataFrame的为基准。
但是,join这个方法还有how这个参数可以设置,合并两个DataFrame的交集或并集。参数为’inner’表示交集,'outer’表示并集。
如果要合并多个Dataframe,可以用list把几个Dataframe装起来,然后使用concat转化为一个新的Dataframe。
参数:
去除重复行,保留重复行中最后一行
去除’c’列中有重复的值所在的行
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。