当前位置:   article > 正文

Python基本统计分析_python统计分析

python统计分析

<生信交流与合作请关注公众号@生信探索>

常见的统计分析方法

import numpy as np
import scipy.stats as spss
import pandas as pd

  • 1

鸢尾花数据集

https://github.com/mwaskom/seaborn-data

df = pd.read_csv("iris.csv",index_col="species")
v1 = df.loc["versicolor",:].petal_length.values
v2 = df.loc["virginica",:].petal_length.values

  • 1

1.组间差异的参数检验

数据是否服从正态分布

符合正态分布(p>0.05)

# Shapiro-Wilk test
stat, p_value = spss.shapiro(v1)
stat, p_value = spss.shapiro(v2)

  • 1

方差齐性检验

方差齐,即v1和v2的方差没有显著性差异,即p>0.05

# 非参数检验,对于数据的分布没有要求
stat, p_value = spss.levene(v1,v2)
# 要求数据服从正态分布
stat, p_value = spss.bartlett(v1,v2)

  • 1

两独立样本的 t 检验

stat, p_value = spss.ttest_ind(v1,v2)

  • 1

非独立样本的 t 检验

配对 Paired Student’s t-test(本例中v1,v2并不是配对样本,这里仅用于演示)

stat, p_value = spss.ttest_rel(v1,v2)
  • 1

one-way ANOVA

  • 检查是否符合正态分布
df.petal_length.groupby(df.index).apply(spss.shapiro)
# species
# setosa        (0.971718966960907, 0.27151283621788025)
# versicolor    (0.9741330742835999, 0.3379890024662018)
# virginica     (0.9673907160758972, 0.1808987259864807)
# Name
  • 1
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/黑客灵魂/article/detail/868383?site
推荐阅读
相关标签
  

闽ICP备14008679号