当前位置:   article > 正文

数据挖掘入门实验(weka)_low_ temp什么意思

low_ temp什么意思
实验1:基于Weka的典型数据挖掘应用
学号: 姓名: XXXX 专业: 计算机系统结构 班级:
实验目标
理解数据挖掘的基本概念,掌握基于Weka工具的基本数据挖掘(分类、回归、聚类、关联规则分析)过程。
实验内容
  1. 下载并安装Java环境(JDK 7.0 64位)。
  2. 下载并安装Weka 3.7版。
  3. 基于Weka的数据分类。
  4. 基于Weka的数据回归。
  5. 基于Weka的数据聚类。
  6. 基于Weka的关联规则分析。
实验步骤
注意:在空白处补充实验过程的截图及文字说明,空间不够可自行扩展。
  1. 下载并安装Java环境(JDK 7.0 64位)
  1. 搜索JDK 7.0 64位版的下载,下载到本地磁盘并安装。

  1. 配置系统环境变量PATH,在末尾补充JDK安装目录的bin子目录,以便于在任意位置都能执行Java程序。

验证安装完成:

  1. 下载并安装Weka 3.7版



  1. 基于Weka的数据分类
  1. 读取“电费回收数据.csv”(逗号分隔列),作为原始数据。



实验开始前,应先去除掉一些在分析中无用的数据
将数据中没有差异的属性去除:
  1. WZCS(违章用电次数)的数据全为0,对于分析没有什么帮助,因此一开始就先
去除。
  1. CUISHOU_COUNT(催交次数)的数据全为0,因此去除。
  2. CONS_NO(编号)该数据只是为了标识不同用户信息,对于电费回收的分析不起
作用,因此去除。
  1. YMD(日期)
  2. RCVED_DATE(实收日期)
TQSC(欠费时长)可以用欠费日期及实收日期计算得出,因此可将YMD、RCVED_DATE这两个属性删去。

  1. 数据预处理:
    1. 将数值型字段规范化至[0,1]区间。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/525571
推荐阅读
相关标签
  

闽ICP备14008679号