赞
踩
1、首先对波士顿房产数据集进行分析
CRIM: 城镇人均犯罪率
ZN: 住宅用地所占比例
INDUS: 城镇中非住宅用地所占比例
CHAS: 查尔斯河(Charles River)变量(若土地位于河流边界,则为 1;否则为 0)
NOX: 环保指数
RM: 每栋住宅的房间数
AGE: 1940 年以前建成的自住单位的比例
DIS: 距离 5 个波士顿的就业中心的加权距离。
RAD: 距离高速公路的便利指数
TAX: 每一万美元的不动产税率
PRTATIO: 城镇中的教师学生比例
B: 城镇中的黑人比例
LSTAT: 地区中有多少房东属于低收入人群
MEDV: 自住房屋房价中位数
通过分析,可知CRIM、ZN、INDUS、NOX、AGE、RAD、TAX、PRTATIO、B是相对数,而
RM、DIS、LSTAT、MEDV是绝对数,其中CHAS是虚拟变量。对于多变量问题,需要将这些特征都具有相近的尺度,可通过数据标准化处理,可帮助梯度下降更快的收敛。
常用的数据标准化方法有三种:
"""
日期:20190305
任务四
1. 波士顿房产数据(完整数据)
2. 实现多变量(手写代码)
3. 数据标准化(手写代码)
4. 网格搜索调参
5 from sklearn.linear_model import LinearRegression对比
"""
#导入用到的库
import sklearn.datasets as datasets
from sklearn.linear_model import LinearRegression #线性回归模型
from sklearn.model_selection
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。