当前位置:   article > 正文

Pandas数据的相关性分析_pandas相关性分析

pandas相关性分析

本文的主要内容是基于中国大学mooc(慕课)中的“Python数据分析与可视化”课程进行整理和总结。
两个事物,表示成X和Y,如何判断他们之间的相关性?
X增大,Y也增大,两个变量正相关;
X增大,Y减小,两个变量负相关;
X增大,Y没有明显变化,两个变量不相关;
度量两个数据的相关性有以下方法:

  • 协方差,如下所示,如果协方差大于0,则表明正相关,若协方差小于0,则为负相关,协方差为0时,X和Y不相关;
    c o v ( X , Y ) = ∑ i = 1 n ( X i − X ˉ ) ( Y i − Y ˉ ) n − 1 cov(X, Y) = \frac{\sum_{i=1}^{n}(X^{i}-\bar{X})(Y^{i}-\bar{Y})}{n - 1} cov(X,Y)=n1i=1n(Xi
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/342855
推荐阅读
  

闽ICP备14008679号