赞
踩
前言
机器学习常用来解决相关分析和回归分析的问题,有时候大家会混淆两者之间的差异,这里通过对比分析来说明两者的区别和联系,最后会以调用sklearn包中LinearRegression方法进行简单线性回归分析为例,说明如何使用python进行数据分析。
1.1 两者的定义
相关分析(Correlation analysis):研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法。
对于线性相关而言有三种类型:正线性相关(总体表现直线朝上);负线性相关;非线性相关。
回归分析(Regression analysis):确定两种或两种以上变量间相互依赖定量关系的统计方法。
根据不同的维度可以将回归分析分为:一元回归和多元multivariate回归分析(因变量多少);简单回归和多重multiple回归分析(自变量多少);线性回归和非线性回归(自变量及因变量间关系类型)。
1.2衡量指标
相关分析:
回归分析:
1.3区别与联系
两者的区别
两者的联系
问题:探究“学习时长”和“学习成绩”之间是否存在相关性关系,如果有找出其回归方程。
2.1理解数据
1、导入数据包
#导入数据包
import warnings
from collections import OrderedDict
import pandas as pd
import numpy as np
warnings.filterwarnings('ignore')
2、创建数据并查看数据
#创建数据并查看数据
examDict={
'学习时间':list(np.arange(0.5,5.5,0.25)),
'学习成绩':[10, 22, 13, 43, 20, 22, 33, 50, 62,
48, 55
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。