当前位置:   article > 正文

数据处理(一)数据清洗_如果要按内逻辑清洗数据

如果要按内逻辑清洗数据


在这里插入图片描述

1、处理重复数据

1、函数法
在这里插入图片描述
在这里插入图片描述

B:countif(A:A,A2) 结果是A2在所有结果中出现的次数;
     A776477 一共在列中出现两次
C:countif(A$2:A3,A3)  结果是在A2-A3 中 A3 第几次出现 
  • 1
  • 2
  • 3

2、高级筛选法

在这里插入图片描述

在这里插入图片描述
3、条件格式法

在这里插入图片描述
4、透视表

在这里插入图片描述
5、删除重复值
在这里插入图片描述

2、处理缺失数据

表格里,缺失值最常见的表现形式就是控制或者错误标识符,可以接受的缺失值在10%以下;

1、定位
在这里插入图片描述

处理缺失值的四种方法:

  • 用样本统计量的值代替缺失值。典型的是用样本平均值代替,如果是分类数据可以用众数代替;
  • 用统计模型计算出来的值去代替缺失值;常见的O型有回归模型、判别模型等;
  • 将有缺失值的记录删除
  • 将缺失值作为另一个类别;
  • 保留记录

缺失值填充快捷键:ctrl+G 定位空白单元格后使输入数据,然后ctrl+Enter 就可以将所有空白纸填充

2、 查找替换

3、数据一致性(数据逻辑错误)

  • 利用IF函数检查错误

在这里插入图片描述

  • 利用条件格式标记错误
    在这里插入图片描述
    在这里插入图片描述

参考:《谁说菜鸟不会数据分析》

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/984105?site
推荐阅读
相关标签
  

闽ICP备14008679号