当前位置:   article > 正文

python 房价数据可视化以数据缺失处理、及回归算法_numpy数据分析房价与可视化

numpy数据分析房价与可视化

基本信息概述

  • 房价数据为他国地区
  • 使用工具为JupyterLab、python3
  • 用到的包
    • 绘图包:seaborn、matplotlib
    • 数据处理包:numpy、pandas
    • 统计计算包:math、scipy
    • 回归模型包:make_pipeline、 RobustScaler、ElasticNet,Lasso、KernelRidge、GradientBoostingRegresso、xgboost

可视化步骤

  • 导入并打印数据
df_train = pd.read_csv('data.csv',encoding = 'gbk') 
df_train
  • 1
  • 2

在这里插入图片描述

  • 打印特征值、索引列
print(df_train.columns)
  • 1

在这里插入图片描述

  • 打印房价相关的数据描述
print(df_train['房价'].describe())
  • 1
  • 绘制每个房价区间的数量
seaborn.set(font=myfont.get_name()) 
plt.figure(figsize=(16,8),dpi=600) 
plt.ylabel('频数')
plt.title('房价分布') 


seaborn.distplot(df_train['房价'],kde=False,hist_kws={"label":"频数"})
plt.legend() 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

在这里插入图片描述
制作散点图,查看房价与居住面积之前的关系

data = pd.concat([df_train['房价'],df_train['居住面积']],axis=1)
plt.figure(figsize = (16,8),dpi = 600)
seaborn.scatterplot(data['居住面积'],data['房价']) 
  • 1
  • 2
  • 3

在这里插入图片描述
绘制散点图,房价与地下室面积之间的关系

data = pd.concat([df_train['房价'],df_train['地下室总面积']],axis =1)
plt.figure(figsize=(16,8),dpi=600)
seaborn.scatterplot(data['地下室总面积'],data['房价'])
  • 1
  • 2
  • 3

在这里插入图片描述
绘制灯箱图,查看房价与材料和质量之间的关系

data = pd.concat([df_train['房价'],df_train['材料和质量']],axis =1)
plt.figure(figsize =(16,8),dpi = 600) 
seaborn.boxplot(data=data,x='材料和质量',y='房价')

  • 1
  • 2
  • 3
  • 4

在这里插入图片描述
绘制灯箱图,查看房价与原施工日期之间的关系

data = pd.concat([df_train['房价'],df_train['原施工日期']],axis = 1) 
plt.figure(figsize=(16,8),dpi=600)
plt.xticks(rotation=90) 
seaborn.boxplot(data=data,x='原施工日期',y='房价')
  • 1
  • 2
  • 3
  • 4

在这里插入图片描述
绘制灯箱图,查看房价与街区之间的关系

data = pd.concat([df_train['房价'],df_train['街区']],axis = 1)
plt.figure(figsize=(16,8),dpi=600) 
plt.xticks(rotation=90) 
seaborn.boxplot(data=data,x='街区',y='房价') 
  • 1
  • 2
  • 3
  • 4

在这里插入图片描述
热力图,查看所有数值型特征之间的相关性

corrmat=df_train.corr() 
plt.figure(figsize=(16,8),dpi=600)

seaborn.heatmap(corrmat,square=True,cmap='YlGnBu',xticklabels=True,yticklabels=True)
  • 1
  • 2
  • 3
  • 4

在这里插入图片描述
找出与房价的相关系数排名靠前的10个特征,画出这10个特征之间的热力图

k = 10  

cols = corrmat.nlargest(k,'房价')['房价'].index 

cm = np.corrcoef(df_train[cols].values.T)

plt.figure(figsize=(16,8),dpi=600) 

hm = seaborn.heatmap(cm,annot=True,square=True,fmt='.2f',annot_kws={'size':10},
                    yticklabels=cols.values,xticklabels=cols.values,cmap='YlGnBu')
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

在这里插入图片描述

全部代码+全部注释

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/148261?site
推荐阅读
相关标签
  

闽ICP备14008679号