赞
踩
相关性系数(Correlation Coefficient)是度量两个变量之间相关程度的统计指标。常见的相关性系数有以下几种:
其中,Xi 和 Yi 分别为两个变量的观测值, Xˉ 和Yˉ 为变量的均值。
其中,di 是每对观测值排名之差,n 是观测值的数量。
其中,C和 D 分别表示一致性和不一致性对数,T1 和 T2 分别表示两个变量的平局对数。
在Pandas库中,DataFrame.corr()
方法用于计算DataFrame各列之间的相关系数。默认情况下,DataFrame.corr()
使用的是皮尔逊相关系数(Pearson Correlation Coefficient)。
以下是一个简单的示例,展示如何使用df.corr()
计算DataFrame各列之间的皮尔逊相关系数:
- import pandas as pd
-
- # 创建示例数据
- data = {
- 'A': [1, 2, 3, 4, 5],
- 'B': [2, 4, 6, 8, 10],
- 'C': [5, 4, 3, 2, 1]
- }
-
- df = pd.DataFrame(data)
-
- # 计算相关系数矩阵
- correlation_matrix = df.corr()
- print(correlation_matrix)
上述代码输出的相关系数矩阵可能如下:
- A B C
- A 1.000000 1.000000 -1.000000
- B 1.000000 1.000000 -1.000000
- C -1.000000 -1.000000 1.000000
如果需要计算其他类型的相关系数,可以通过method
参数指定,如:
method='pearson'
:计算皮尔逊相关系数(默认)。method='kendall'
:计算肯德尔相关系数。method='spearman'
:计算斯皮尔曼相关系数。- # 计算斯皮尔曼相关系数矩阵
- spearman_corr = df.corr(method='spearman')
- print(spearman_corr)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。