当前位置:   article > 正文

使用Pandas进行数据预处理_利用pandas快速实现数据的预处理分析

利用pandas快速实现数据的预处理分析

一、合并数据
1.堆叠合并数据
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.主键合并数据
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

3.重叠合并数据
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
二、清洗数据
1.检测与处理重复值
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
去重后仅剩145个数据
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.检测预处理缺失值
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
三、标准化数据
1.离差标准化(最大/小值)
离差标准化公式:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述

2.标准差标准化数据
标准差标准化数据的公式及特点:
在这里插入图片描述在这里插入图片描述

3.小数定标标准化数据
小数定标标准化数据公式及对比:在这里插入图片描述
四、转换数据
1.哑变量处理类别数据在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述

2.离散化连续型数据
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
value_counts()并不是未带任何参数,而是所有参数都是默认的
也就是说会默认显示数字形式,默认排序,默认降序,默认删除na
在这里插入图片描述在这里插入图片描述

在这里插入图片描述
小结
在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/148151
推荐阅读
相关标签
  

闽ICP备14008679号