当前位置:   article > 正文

0304线性回归(多变量)-基于波士顿房产数据集_rm,age,black,lstat,crim,zn,indus,prratio,tax,chas,

rm,age,black,lstat,crim,zn,indus,prratio,tax,chas,dis,rad,nox

1、首先对波士顿房产数据集进行分析

CRIM: 城镇人均犯罪率
ZN: 住宅用地所占比例
INDUS: 城镇中非住宅用地所占比例
CHAS: 查尔斯河(Charles River)变量(若土地位于河流边界,则为 1;否则为 0)
NOX: 环保指数
RM: 每栋住宅的房间数
AGE: 1940 年以前建成的自住单位的比例
DIS: 距离 5 个波士顿的就业中心的加权距离。
RAD: 距离高速公路的便利指数
TAX: 每一万美元的不动产税率
PRTATIO: 城镇中的教师学生比例
B: 城镇中的黑人比例
LSTAT: 地区中有多少房东属于低收入人群
MEDV: 自住房屋房价中位数
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14

通过分析,可知CRIM、ZN、INDUS、NOX、AGE、RAD、TAX、PRTATIO、B是相对数,而
RM、DIS、LSTAT、MEDV是绝对数,其中CHAS是虚拟变量。对于多变量问题,需要将这些特征都具有相近的尺度,可通过数据标准化处理,可帮助梯度下降更快的收敛。
常用的数据标准化方法有三种:

  • 规范化方法
    在这里插入图片描述
  • 正规化方法
    在这里插入图片描述
  • 归一化方法
    在这里插入图片描述
    2、实战
"""
日期:20190305
任务四
1. 波士顿房产数据(完整数据)
2. 实现多变量(手写代码)
3. 数据标准化(手写代码)
4. 网格搜索调参
5 from sklearn.linear_model import LinearRegression对比
"""
#导入用到的库
import sklearn.datasets as datasets
from sklearn.linear_model import LinearRegression  #线性回归模型
from sklearn.model_selection 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小桥流水78/article/detail/842025
推荐阅读
相关标签
  

闽ICP备14008679号