当前位置:   article > 正文

机器学习1:线性回归模型解决波士顿房价预测和研究生入学率问题_研究生入学预测回归分析

研究生入学预测回归分析

Python机器学习实战1:使用线性回归模型来解决波士顿房价预测和研究生入学率问题

在这里插入图片描述

boston房价预测

导入库

from  sklearn.linear_model import LinearRegression
from  sklearn.datasets import load_boston
import matplotlib.pyplot as plt
%matplotlib inline
  • 1
  • 2
  • 3
  • 4

获取数据集

bosten = load_boston()
  • 1

线性回归

  • 模型训练
clf = LinearRegression()
clf.fit(bosten.data[:,5:6],bosten.target)  #模型训练
x = bosten.data[:,5:6]
  • 1
  • 2
  • 3
  • 回归系数
clf.coef_  
  • 1
array([9.10210898])
  • 1
  • 预测值
y_pre = clf.predict(bosten.data[:,5:6])  #模型的输出值
  • 1
  • 可视化
plt.scatter(x,bosten.target)
plt.plot(x,y_pre)
plt.show()
  • 1
  • 2
  • 3

在这里插入图片描述

研究生入学率

导入库

import pandas as pd
from sklearn.linear_model import LogisticRegression  #逻辑回归
from sklearn.model_selection import train_test_split  #测试集训练集分割
from sklearn.metrics import classification_report
  • 1
  • 2
  • 3
  • 4

导入数据

data = pd.read_csv(r"LogisticRegression.csv")
data_tr,data_te,label_tr,label_te = train_test_split(data.iloc[:,1:],data["admit"],test_size = 0.2)
  • 1
  • 2
data.iloc[:,1:]
  • 1
gregparank
03803.613
16603.673
28004.001
36403.194
45202.934
............
3956204.002
3965603.043
3974602.632
3987003.652
3996003.893

400 rows × 3 columns

data_tr.head()
  • 1
gregparank
2525204.002
946603.442
415803.322
28004.001
2076403.631
data_te.head()
  • 1
gregparank
454603.453
3116603.672
3916603.882
3577203.311
1177003.722

模型训练

clf = LogisticRegression()
clf.fit(data_tr,label_tr)  #模型训练
pre = clf.predict(data_te) #模型预测
  • 1
  • 2
  • 3
  • 预测出来的标签,label_te实际值
pre  
  • 1
array([0, 0, 0, 1, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 1, 1, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], dtype=int64)
  • 1
  • 2
  • 3
  • 4
  • sklearn中的classification_report函数用于显示主要分类指标的文本报告.在报告中显示每个类的精确度,召回率,F1值等信息。
res = classification_report(label_te,pre)
  • 1
print(res)
  • 1
              precision    recall  f1-score   support

           0       0.71      0.89      0.79        56
           1       0.40      0.17      0.24        24

    accuracy                           0.68        80
   macro avg       0.56      0.53      0.51        80
weighted avg       0.62      0.68      0.63        80
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

推荐阅读

  1. 使用Python完成时间序列分析基础
  2. SPSS建立时间序列乘法季节模型实战案例
  3. Python建立时间序列ARIMA模型实战案例

到这里就结束了,如果对你有帮助你,欢迎点赞关注,你的点赞对我很重要

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Gausst松鼠会/article/detail/109394
推荐阅读
相关标签
  

闽ICP备14008679号