当前位置:   article > 正文

​用Tensorflow实现线性回归模型

tensorflow 回归模型

点击上方码农的后花园”,选择星标” 公众号

精选文章,第一时间送达

Tensorflow 实现线性回归模型

1.线性与非线性回归

  • 线性回归 Linear Regression:两个变量之间的关系是一次函数关系的——图像是直线,叫做线性。线性是指广义的线性,也就是数据与数据之间的关系,如图x1。

  • 非线性回归:两个变量之间的关系不是一次函数关系的——图像不是直线,叫做非线性,如图x2。86e0198d7d4c39c6becfd2a952e89352.png

  • 一元线性回归:只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。函数表达: y=bx+a。

  • 多元线性回归:包括两个或两个以上相互独立的自变量(x1,x2,x3...),且因变量(y)和自变量之间是线性关系,则称为多元线性回归分析。函数表达:17a81eb321b9fff6250874d597cabdc3.png

  • 线性回归在深度学习中的应用: 在深度学习中,我们就是要根据已知数据点(自变量)和因变量(y)去训练模型得到未知参数a和b、 和的具体值,从而得到预测模型,在这里()相当于深度学习中目标对象的特征,(y)相当于具体的目标对象。得到预测模型之后再对未知的自变量x进行预测,得到预测的y。

  • 线性回归问题与分类问题:与回归相对的是分类问题(classification),分类问题预测输出的y值是有限的,预测值y只能是有限集合内的一个。而当要预测值y输出集合是无限且连续,我们称之为回归。比如,天气预报预测明天是否下雨,是一个二分类问题;预测明天的降雨量多少,就是一个回归问题。

案例讲解

了解基础概念之后,使用Tensorflow实现一个简单的一元线性回归问题, 调查学历和收入之间的线性关系,如下所示:3ca96cb5c652ef3d46ff89a9f5d389ad.png

求解未知参数a和b的方法:

85729d9d9ae1e60856c41b6729945c43.png

1.数据集

模型训练的数据存储在一个.csv文件里,Education代表学历【自变量x】,Income代表收入【因变量y】。

  • 目标:我们要利用已知的Education和income数据值,求解未知参数a和b的值,得到Education和Income之间的线性关系。c53219c7b7f0961d5cda2522eb07fddd.png



2.读取训练数据Income.csv并可视化展示

  1. import tensorflow as tf
  2. import numpy as np
  3. 1.查看tensorflow版本
  4. print("Tensorflow Version{}".format(tf.__version__))
  5. 2.pandas读取包含线性关系的.csv文件
  6. import pandas as pd
  7. data = pd.read_csv('D:\Project\TesorFlow\datasets\Income.csv')
  8. print(data)
  9. 3.绘制线性回归关系-散点图
  10. import matplotlib.pyplot as plt
  11. plt.scatter(data.Education,data.Income)
  12. plt.show()
82977c873d0c4e877edf9ba314b59d61.png

3.利用Tensorflow搭建和训练神经网络模型【线性回归模型的建立】

  1. 4.顺序模型squential的建立
  2. # 顺序模型是指网络是一层一层搭建的,前面一层的输出是后一层的输入。
  3. model = tf.keras.Sequential()
  4. model.add(tf.keras.layers.Dense(1,input_shape=(1,)))
  5. # dense(输出数据的维度,输入数据的维度)
  6. 5.查看模型的结构
  7. model.summary()
  8. 6.编译模型 - 配置的过程, 优化算法方式(梯度下降)、损失函数
  9. # Adam优化器的学习速率默认为0.01
  10. model.compile(optimizer='adam',
  11.               loss = 'mse')
  12. 7.训练模型,记录模型的训练过程 history
  13. # 训练过程是loss函数值降低的过程:
  14. # 即不断逼近最优的a和b参数值的过程
  15. # 这个过程要训练很多次epoch,epoch是指对所有训练数据训练的次数
  16. history = model.fit(x,y,epochs=100)
  • model.summary(): 查看我们创建的神经网络模型,这里我们只添加了一层全连接层。abbe7b3ed233f67aa2c6e4e3eff5d418.png

  • 训练过程:这里只训练100个epoch.de88d3ee7cae4e88feae991cd87e4ce6.png

4. 模型预测

  1. 8.已知数据预测
  2. model.predict(x)
  3. print(model.predict(x))
  4. 9.随机数据预测: 
  5. """
  6. # 注意:pandas数据结构是数据框DataFrame和 序列 Series
  7. # 序列(Series)是二维表格中的一列或者一行。实际上,当访问DataFrame的一行时,pandas自动把该行转换为序列;当访问DataFrame的一列时,Pandas也自动把该列转换为序列。
  8. # 序列是由一组数据(各种NumPy数据类型),以及一组与之相关的数据标签(索引)组成,序列不要求数据类型是相同的,序列可以看作是一维数组(一行或一列)
  9. # 序列的表现形式为:索引在左边,值在右边。由于没有显式为Series指定索引,pandas会自动创建一个从0到N-1的整数型索引。
  10. # """
  11. # test_predict = model.predict(pd.Series([20]))  # 所以这里输入时需要将其转换为Series结构
  12. test_predict = model.predict(pd.Series([10,20]))  # 预测的数据为1020
  13. print(test_predict)
  14. print(pd.DataFrame([(10,20,30)]))
  • 已知结果的数据预测的结果: 查看我们创建的神经网络模型,这里我们只添加了一层全连接层。5df94d7b826840c3400939d2349e8196.png

  • 未知结果的数据预测的结果: 可以看到预测结果很差,说明我们的神经网络模型并没有训练好,求解得到的未知参数的a和b的值很差。ad4456e1d67fdf69c0deec748011efef.png

  • 解决办法:: 加深神经网络模型的参数,训练更多的次数epoch或者添加实验数据。

sklearn库有写好了的线性回归函数,from sklearn.linear_model import LinearRegression直接导入即可。

这期使用Tensorflow框架实现线性回归模型的案例。在后台回复:关键词「TensorFlow」,即可快速下载号主使用Tenworflow2.0框架的深度学习入门相关学习教程和笔记。

号主,深度学习入门学习笔记分享(附笔记实战代码)

5e92b4808d56d6ba25df6754d46e35df.png

本期内容就到这里啦~如果本文对您有帮助,也请帮忙点个 赞 + 在看 啦!❤️

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/笔触狂放9/article/detail/295891
推荐阅读
相关标签
  

闽ICP备14008679号