赞
踩
理解数据
import pandas as pd
import numpy as np
import sklearn.datasets as datasets
from sklearn.linear_model import LinearRegression,SGDRegressor
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error,classification_report
import matplotlib.pyplot as plt
from sklearn.linear_model import Ridge
from sklearn.externals import joblib
1.加载boston房价数据
boston=datasets.load_boston()
print(boston.DESCR)
boston.feature_names
X=boston.data
Y=boston.target
boston房价数据一共有506行。13个特征,分别是:
‘CRIM’, ‘ZN’, ‘INDUS’, ‘CHAS’, ‘NOX’, ‘RM’, ‘AGE’, ‘DIS’, ‘RAD’,
‘TAX’, ‘PTRATIO’, ‘B’, ‘LSTAT’;
各个特征的含义:
CRIM:城镇人均犯罪率。
ZN:住宅用地超过 25000 sq.ft. 的比例。
INDUS:城镇非零售商用土地的比例。
CHAS:查理斯河空变量(如果边界是河流,则为1;否则为0)。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。