赞
踩
<生信交流与合作请关注公众号@生信探索>
常见的统计分析方法
import numpy as np
import scipy.stats as spss
import pandas as pd
https://github.com/mwaskom/seaborn-data
df = pd.read_csv("iris.csv",index_col="species")
v1 = df.loc["versicolor",:].petal_length.values
v2 = df.loc["virginica",:].petal_length.values
符合正态分布(p>0.05)
# Shapiro-Wilk test
stat, p_value = spss.shapiro(v1)
stat, p_value = spss.shapiro(v2)
方差齐,即v1和v2的方差没有显著性差异,即p>0.05
# 非参数检验,对于数据的分布没有要求
stat, p_value = spss.levene(v1,v2)
# 要求数据服从正态分布
stat, p_value = spss.bartlett(v1,v2)
stat, p_value = spss.ttest_ind(v1,v2)
配对 Paired Student’s t-test(本例中v1,v2并不是配对样本,这里仅用于演示)
stat, p_value = spss.ttest_rel(v1,v2)
df.petal_length.groupby(df.index).apply(spss.shapiro)
# species
# setosa (0.971718966960907, 0.27151283621788025)
# versicolor (0.9741330742835999, 0.3379890024662018)
# virginica (0.9673907160758972, 0.1808987259864807)
# Name
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。