赞
踩
用途:计算总体标准差
格式:T stddev(T,T,T,...)
用途:计算样本标准差
格式:T stddev_samp(T,T,T,...)
用途:返回组内某个数字列的方差
接口格式:DOUBLE variance(column name)
用途:返回组内某个数字列的方差
接口格式:DOUBLE var_pop(column name)
用途:返回组内某个数字列的无偏样本方差
接口格式:DOUBLE var_samp(column name)
用途:返回组内某个数字列的标准差
格式:DOUBLE stddev_pop(column name)
用途:返回组内两个数字列的总体协方差
格式:DOUBLE covar_pop(col1,col2)
用途:返回组内两个数字列的样本协方差
格式:DOUBLE covar_samp(col1,col2)
用途:返回组内两个数字列的皮尔逊相关系数
格式:DOUBLE corr(col1,col2)
用途:返回消除了重复元素的数组
格式:array collect_set(column name)
用途:返回允许重复元素的数组
格式:array collect_list(column name)
用途:该函数将已经排序的分区分到x个桶中,并为每行分配一个桶号。这可以容易的计算三分位,四分位,十分位,百分位和其它通用的概要统计
格式:INTEGER ntile(INTEGER)
用途:返回组内某个列精确的第p位百分数,p必须在0和1之间
格式:DOUBLE percentile(BIGINT,DOUBLE)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。