赞
踩
相关性分析是指通过对变量的分析,判定两个变量因素的相关程度,然后通过对其中一个因素的引导,来影响另一个因素。
需要注意是,一般讨论的相关性分析均指代“线性相关性”。
假设我们通过分析发现,用户的网页浏览行为和用户的购买行为呈现较强的正相关性,那么理论上,产品运营同学通过引导用户浏览更多的网页便可以带来更多的购买订单数,进而提升平台的收入。
那么怎么判定两者是否存在正相关关系呢?
用户在网页上留下了行为数据,我们随机选取了100组数据(X,Y),X为用户的浏览数据(日浏览门店数量),Y为用户的购买数据(日购买商品数)。
判定两者相关的方式有两种:图形观测法:通过绘制散点图判断两者是否存在一定相关关系
科学计算法:通过计算相关性系数r
图形观测法可以通过python直接绘制散点图来实现,形象可见,但是无法数据化。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# 随机生成一组数据(X,Y)
data = pd.DataFrame(np.random.randn(200,2)*100, columns=['X','Y'])
# 绘制散点图
plt.figure(figsize = (6,6)) # 图片像素大小
plt.scatter(data.X, data.Y,color="blue") # 散点图绘制
plt.grid() # 显示网格线
plt.
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。