当前位置:   article > 正文

Pandas 基础 task1_pandas取五行

pandas取五行

df.head()函数 读取表格前五行数据df.taill(n) 读取表格后五行数据,n默认为5,可以指定n参数显示多少行np.random.randn(d0,d1,d2……dn)1)当函数括号内没有参数时,则返回一个浮点数;2)当函数括号内有一个参数时,则返回秩为1的数组,不能表示向量和矩阵;3)当函数括号内有两个及以上参数时,则返回对应维度的数组,能表示向量或矩阵;4)np.random.standard_normal()函数与np.random.randn()类似,但是np.random.standard_normal()的输入参数为元组(tuple).5)np.random.randn()的输入通常为整数,但是如果为浮点数,则会自动直接截断转换为整数。df.mean()等价于df.mean(0)。把轴向数据求平均,得到每列数据的平均值。df.mean(1)按照另外一个axis的方向来求平均,得到每行数据的平均值。df1 A112233df2A122331count 返回非缺失值元素个数value_counts 返回每个元素有多少个info函数返回有哪些 列、有多少非缺失值、每列的类型
describe默认统计数值数据的各个统计量,包括最大值最小值,标准差等,可以自行选择分位数

idxmax 函数返回最大值索引,idxmin类似
nlargest函数返回前几个大的元素值,nsmallest类似

clip对超过或者低于某些值的数据进行截断

replace对某些值进行替换

pandas 的 apply() 函数可以作用于 Series 或者整个 DataFrame,功能也是自动遍历整个 Series 或者 DataFrame, 对每一个元素运行指定的函数。
df用apply是列迭代,series用apply是行迭代,有时候如果你想要df进行行迭代的话,只要对df进行用T转置即可。有很多时候不清楚函数传入了什么,就可以用lambda x:print(x)看一下

zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。
如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同。 在 Python 3.x 中为了减少内存,zip() 返回的是一个对象。如需展示列表,需手动 list() 转换。

问题一 Series和DataFrame有哪些常见属性和方法?
http://www.jsledd.cn/2017/03/14/python-pandas-series-dataframe/#series%E5%9F%BA%E6%9C%AC%E5%8A%9F%E8%83%BD

问题二
value_counts会统计缺失值吗?
不会

问题三 与idxmax和nlargest功能相反的是哪两组函数?
idxmin
nsmallest

问题四 在常用函数一节中,由于一些函数的功能比较简单,因此没有列入,现在将它们列在下面,请分别说明它们的用途并尝试使用。
sum/mean/median/mad/min/max/abs/std/var/quantile/cummax/cumsum/cumprod

sum 调用DataFrame的sum方法将会返回一个含有列小计的Series:传入axis=1将会按行进行求和运算

In [111]: df
Out[111]:
    one  two
a  1.40  NaN
b  7.10 -4.5
c   NaN  NaN
d  0.75 -1.3
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
In [112]: df.sum()
Out[112]:
one    9.25
two   -5.80
  • 1
  • 2
  • 3
  • 4

mad() 根据平均值计算平均绝对离差 df.mad
sr.unique Series去重
sr.value_counts() Series统计频率,并从大到小排序,DataFrame没有这个方法
sr.describe() 返回基本统计量和分位数
df.max() 求最大值
df.min() 求最大值
df.sum(axis=0) 按各列求和
df.mean() 按各列求平均值
df.median() 求中位数
df.var() 求方差
df.std() 求标准差
df.mad() 根据平均值计算平均绝对利差
df.cumsum() 求累计和
sr1.corr(sr2) 求相关系数
df.cov() 求协方差矩阵
df1.corrwith(df2) 求相关系数
pd.crosstab(df[‘col1’], df[‘col2’]) 交叉表,计算分组的频率
网址: https://www.cnblogs.com/sxron/p/11694436.html
问题五 df.mean(axis=1)是什么意思?它与df.mean()的结果一样吗?第一问提到的函数也有axis参数吗?怎么使用?
df.mean()等价于df.mean(0)。把轴向数据求平均,得到每列数据的平均值。
df.mean(1)按照另外一个axis的方向来求平均,得到每行数据的平均值。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/74947
推荐阅读
相关标签
  

闽ICP备14008679号