赞
踩
最近做医学数据分析的结果展现,提到了两个问题:1. 机器学习方法相比较传统统计学方法而言,能产生什么新的结果?2.这些新的结果能不能用统计学理论来解释?
于是简单Google了一下。很不幸,没有找到专门针对医学分析的,倒是发现一篇博客,讲统计学与机器学习、数据科学的区别。个人觉得挺有道理的。摘录主要思想如下。
文中提到,统计学家最重要的任务是处理由采样引起的变异性。由此为出发点,设计好的数据收集过程,量化不确定性,理解方法相关的统计参数。
个人理解,在数据全集很难获得的情况下,需要通过采样来选择某一部分的数据。这个采样的结果受随机性的影响,也就是说,数据是随机分布的,那采样就需要根据全集固有的随机分布来做。可是很不幸,全集的随机分布很难得到,于是就有种种估计的方法。而统计学也提供了相应的方法,去评估估计的方法是否是合理的、有可能反应全集的。
- 人口统计。无法做全集,只能做采样
- 医学临床试验。对结果的精确性和可解释性要求非常高,逻辑严密
- 小样本高维数据。比如基因数据。
- 大数据领域。能拿到数据全集的情况。不需要采样后再
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。