当前位置:   article > 正文

相关性模型 之 皮尔逊相关系数与斯皮尔曼相关系数_斯皮尔曼相关系数和皮尔森相关系数

斯皮尔曼相关系数和皮尔森相关系数

皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数。它们可用来衡量两个变量之间的相关性的大小,根据数据满足的不同条件,我们要选择不同的相关系数进行计算和分析(建模论文中最容易用错的方法)。

一、基本概念

总体——所要考察对象的全部个体叫做总体.
我们总是希望得到总体数据的一些特征(例如均值方差等)
样本——从总体中所抽取的一部分个体叫做总体的一个样本

计算这些抽取的样本的统计量来估计总体的统计量:
例如使用样本均值、样本标准差来估计总体的均值(平均水平)和总体的标准差(偏离程度)

假设检验:参阅《概率论与数理统计》第八章

二、皮尔逊Pearson相关系数

就是概率论学的相关系数。一般我们认为不加前缀说明的相关系数都是皮尔逊相关系数

首先我们要理解协方差
在这里插入图片描述关于协方差:如果X、Y(相对于均值)变化方向相同则乘积为正,反之为负

注:协方差的大小和两个变量的量纲有关,因此不适合做比较。
所以我们引入皮尔逊相关系数剔除了量纲的影响,即将X和Y标准化后的协方差

(1)总体皮尔逊相关系数
在这里插入图片描述(2)样本皮尔逊相关系数
在这里插入图片描述

一些误区

以上的相关系数只是用来来衡量两个变量线性相关程度的指标;即我们必须先确认这两个变量是线性相关的,然后这个相关系数才能告诉你他俩相关程度如何(先画散点图)
eg.形式上必须大致满足 Y = a*X+b
例如下面几个错误示例
在这里插入图片描述
总结:

  1. 如果两个变量本身就是线性的关系,那么皮尔逊相关系数绝对值大的就是相关性强,小的就是相关性弱;
  2. 在不确定两个变量是什么关系的情况下,即使算出皮尔逊相关系数,发现很大,也不能说明那两个变量线性相关,甚至不能说他们相关,我们一定要画出散点图来看才行。

相关系数的显著性

在这里插入图片描述
一般相关系数大小与相关性的参照如上。**但是!!!**上表所定的标准从某种意义上说是武断的和不严格的。对相关系数的解释是依赖于具体的应用背景和目的的。

所以,比起相关系数的大小,我们往往更关注的是显著性。(假设检验)

  1. 用绘制散点图观察是否为线性(SPSS更为方便)
  2. 对数据进行描述性统计(每个指标的最小值、最大值、均值、中位数值、偏度、峰度、标准差等)
  3. 计算相关系数矩阵(corrcoef)。可以对其进行数据可视化处理(Excel)
  4. 对皮尔逊相关系数进行假设检验:
    (1)查表法
    在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

注:
在数理统计中,第二步的原假设和备择假设中的

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/675279
推荐阅读
相关标签