Pandas 基础 task1_pandas取五行

作者：Monodyee | 2024-02-10 18:33:54

踩

pandas取五行

df.head()函数读取表格前五行数据df.taill(n) 读取表格后五行数据，n默认为5,可以指定n参数显示多少行np.random.randn(d0,d1,d2……dn)1)当函数括号内没有参数时，则返回一个浮点数；2）当函数括号内有一个参数时，则返回秩为1的数组，不能表示向量和矩阵；3）当函数括号内有两个及以上参数时，则返回对应维度的数组，能表示向量或矩阵；4）np.random.standard_normal（）函数与np.random.randn()类似，但是np.random.standard_normal（）的输入参数为元组（tuple）.5)np.random.randn()的输入通常为整数，但是如果为浮点数，则会自动直接截断转换为整数。df.mean()等价于df.mean(0)。把轴向数据求平均，得到每列数据的平均值。df.mean(1)按照另外一个axis的方向来求平均，得到每行数据的平均值。df1 A112233df2A122331count 返回非缺失值元素个数value_counts 返回每个元素有多少个info函数返回有哪些列、有多少非缺失值、每列的类型
describe默认统计数值数据的各个统计量，包括最大值最小值，标准差等，可以自行选择分位数

idxmax 函数返回最大值索引，idxmin类似
nlargest函数返回前几个大的元素值，nsmallest类似

clip对超过或者低于某些值的数据进行截断

replace对某些值进行替换

pandas 的 apply() 函数可以作用于 Series 或者整个 DataFrame，功能也是自动遍历整个 Series 或者 DataFrame, 对每一个元素运行指定的函数。
df用apply是列迭代，series用apply是行迭代，有时候如果你想要df进行行迭代的话，只要对df进行用T转置即可。有很多时候不清楚函数传入了什么，就可以用lambda x:print(x)看一下

zip() 函数用于将可迭代的对象作为参数，将对象中对应的元素打包成一个个元组，然后返回由这些元组组成的列表。
如果各个迭代器的元素个数不一致，则返回列表长度与最短的对象相同。在 Python 3.x 中为了减少内存，zip() 返回的是一个对象。如需展示列表，需手动 list() 转换。

问题一 Series和DataFrame有哪些常见属性和方法？
http://www.jsledd.cn/2017/03/14/python-pandas-series-dataframe/#series%E5%9F%BA%E6%9C%AC%E5%8A%9F%E8%83%BD

问题二
value_counts会统计缺失值吗？
不会

问题三与idxmax和nlargest功能相反的是哪两组函数？
idxmin
nsmallest

问题四在常用函数一节中，由于一些函数的功能比较简单，因此没有列入，现在将它们列在下面，请分别说明它们的用途并尝试使用。
sum/mean/median/mad/min/max/abs/std/var/quantile/cummax/cumsum/cumprod

sum 调用DataFrame的sum方法将会返回一个含有列小计的Series：传入axis=1将会按行进行求和运算

In [111]: df
Out[111]:
    one  two
a  1.40  NaN
b  7.10 -4.5
c   NaN  NaN
d  0.75 -1.3
1
2
3
4
5
6
7

In [112]: df.sum()
Out[112]:
one    9.25
two   -5.80
1
2
3
4

mad() 根据平均值计算平均绝对离差 df.mad
sr.unique Series去重
sr.value_counts() Series统计频率，并从大到小排序，DataFrame没有这个方法
sr.describe() 返回基本统计量和分位数
df.max() 求最大值
df.min() 求最大值
df.sum(axis=0) 按各列求和
df.mean() 按各列求平均值
df.median() 求中位数
df.var() 求方差
df.std() 求标准差
df.mad() 根据平均值计算平均绝对利差
df.cumsum() 求累计和
sr1.corr(sr2) 求相关系数
df.cov() 求协方差矩阵
df1.corrwith(df2) 求相关系数
pd.crosstab(df[‘col1’], df[‘col2’]) 交叉表，计算分组的频率
网址： https://www.cnblogs.com/sxron/p/11694436.html
问题五 df.mean(axis=1)是什么意思？它与df.mean()的结果一样吗？第一问提到的函数也有axis参数吗？怎么使用？
df.mean()等价于df.mean(0)。把轴向数据求平均，得到每列数据的平均值。
df.mean(1)按照另外一个axis的方向来求平均，得到每行数据的平均值。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/Monodyee/article/detail/74947