当前位置:   article > 正文

Hive:聚合函数_hive stddev函数

hive stddev函数

函数名称:stddev

用途:计算总体标准差

格式:T stddev(T,T,T,...)

函数名称:stddev_samp

用途:计算样本标准差

格式:T stddev_samp(T,T,T,...)

函数名称:variance

用途:返回组内某个数字列的方差

接口格式:DOUBLE variance(column name)

函数名称:var_pop

用途:返回组内某个数字列的方差

接口格式:DOUBLE var_pop(column name)

函数名称:var_samp

用途:返回组内某个数字列的无偏样本方差

接口格式:DOUBLE var_samp(column name)

函数名称:stddev_pop

用途:返回组内某个数字列的标准差

格式:DOUBLE stddev_pop(column name)

函数名称:covar_pop

用途:返回组内两个数字列的总体协方差

格式:DOUBLE covar_pop(col1,col2)

函数名称:covar_samp

用途:返回组内两个数字列的样本协方差

格式:DOUBLE covar_samp(col1,col2)

函数名称:corr

用途:返回组内两个数字列的皮尔逊相关系数

格式:DOUBLE corr(col1,col2)

函数名称:collect_set

用途:返回消除了重复元素的数组

格式:array collect_set(column name)

函数名称:collect_list

用途:返回允许重复元素的数组

格式:array collect_list(column name)

函数名称:ntile

用途:该函数将已经排序的分区分到x个桶中,并为每行分配一个桶号。这可以容易的计算三分位,四分位,十分位,百分位和其它通用的概要统计

格式:INTEGER ntile(INTEGER)

函数名称:percentile

用途:返回组内某个列精确的第p位百分数,p必须在0和1之间

格式:DOUBLE percentile(BIGINT,DOUBLE)

 

 

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/933328
推荐阅读
相关标签
  

闽ICP备14008679号