搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
羊村懒王
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
前端面试必考题:介绍项目和项目难点
2
【STM32学习】HAL库点灯学习
3
探索LTP Python Interface:高效处理自然语言的利器
4
做什么样的软件才能赚钱?学什么样的知识才能赚钱?_什么软件能学习又能赚钱
5
达梦数据库——学习笔记四(达梦数据库自增列的实现)_达梦 identity
6
自动驾驶感知——多传感器融合技术_汽车多传感器融合
7
微信小程序开发中的图像处理和海报生成_微信小程序生成海报
8
tensorflow+小白入门笔记︱基本张量tensor理解与tensorflow运行结构_local tetra pattern
9
git统计代码总行数
10
git教程(基于vscoede)_vscode git版本回退
当前位置:
article
> 正文
Hive窗口函数(开窗函数)_hive开窗函数排序优化
作者:羊村懒王 | 2024-06-01 06:59:26
赞
踩
hive开窗函数排序优化
1
)相关函数说明
OVER():指定分析函数工作的数据窗口大小,这个数据窗口大小可能会随着行的变而变化。
CURRENT ROW
:当前行
n PRECEDING
:往前
n
行数据
n FOLLOWING
:往后
n
行数据
UNBOUNDED
:起点,
UNBOUNDED PRECEDING
表示从前面的起点,
UNBOUNDED FOLLOWING
表示到后面的终点
LAG(col,n,default_val)
:往前第
n
行数据
LEAD(col,n, default_val)
:往后第
n
行数据
NTILE(n)
:把有序窗口的行分发到指定数据的组中,各个组有编号,编号从
1
开始,对
于每一行,
NTILE
返回此行所属的组的编号。
注意:
n
必须为
int
类型。
2
)数据准备:
name
,
orderdate
,
cost
3
)需求
(1)查询在
2017
年
4
月份购买过的顾客及总人数
(2)查询顾客的购买明细及月购买总额
(3)上述的场景
,
将每个顾客的
cost
按照日期进行累加
(4)查询每个顾客上次的购买时间
(5)查询前
20%
时间的订单信息
4
)创建本地
business.txt
,导入数据
[atguigu@hadoop102 datas]$ vi business.txt
5
)创建
hive
表并导入数据
6
)按需求查询数据
(1) 查询在 2017
年
4
月份购买过的顾客及总人数
(2) 查询顾客的购买明细及月购买总额
(3) 将每个顾客的 cost
按照日期进行累加
rows 必须跟在
order by
子句之后,对排序的结果进行限制,使用固定的行数来限制分
区中的数据行数量
(4) 查看顾客上次的购买时间
(5) 查询前 20%
时间的订单信息
2.6 Rank
1
)函数说明
RANK()
排序相同时会重复,总数不会变
DENSE_RANK()
排序相同时会重复,总数会减少
ROW_NUMBER()
会根据顺序计算
2
)数据准备
3
)需求
计算每门学科成绩排名。
4
)创建本地
score.txt
,导入数据
[atguigu@hadoop102 datas]$ vi score.txt
5
)创建
hive
表并导入数据
6
)按需求查询数据
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/羊村懒王/article/detail/656536
推荐阅读
article
Hive
-
分区
与
分桶
详解
(超详细)
_
hive
分桶
...
本文将介绍
Hive
中的两个重要概念:
分区
和
分桶
。在大数据处理场景下,通过合理地使用
分区
和
分桶
可以提高查询性能、管理灵活性...
赞
踩
article
hive
_
partiiton
rename
hive
...
hive
:
hive
基于hadoop的一个数据仓库工具,可以将结构化的数据映射为一张数据库表
hive
调用cli,drive...
赞
踩
article
hive
分位函数
percentile
和
percentile
_
approx
误区和
解决方案
_percen...
percentile
和
percentile
_
approx
对分位数的计算_
percentile
hive
percentil...
赞
踩
article
Hive
内置函数_
hive
内置函数...
九、
Hive
内置函数1.nvl2.case when then else end3.concat4.concat_ws...
赞
踩
article
>
<>em
>
hive
>
<>/em
>
>
<>em
>
sql
>
<>/em
>
大全,
函数
,运算符,字符处理_
>
<>em
>
hive
>
<>/em
>
>
<>em
>
sql
>
<>/em
>
>
<>em
>
的
>
<>/em
>
>
<>
>
...
>
<>em
>
hive
>
<>/em
>
>
<>em
>
sql
>
<>/em
>
大全目录一、关系运算:… 4等值比较: =. 4不等值比较:
>
<>
>
. 4小于比较:
>
<>. 4小于等于比较...
赞
踩
article
【大
数据
+爬虫】基于
SpringBoot
的
智能家居
销量
数据
分析
系统
Scrapy
爬虫/大
数据
Hadoo...
基于
SpringBoot
的
Scrapy
爬虫和大
数据
和大屏可视化的
智能家居
销售
数据
分析
系统是一项创新性的技术解决方案,旨在...
赞
踩
article
【
Hive
】(十四)
Hive
项目
实战之
电子商务
消费行为
分析_
hive
项目
实战_
hive
大
数据
案例实...
Hive
学习过程中的一个练习
项目
,如果不妥的地方或者更好的建议,欢迎指出!
hive
大
数据
案例实践 ...
赞
踩
article
Execution Error,
return
code
3 from org.
ap
ache.had...
还有一些其他可能的原因,例如内存不足、Hive配置参数等。可以尝试调整Hive on
Spark
的相关配置参数,例如ma...
赞
踩
article
Hive
collect
_set函数...
2019独角兽企业重金招聘Python工程师标准>>> ..._
collect
set函数col...
赞
踩
article
Hive
的
collect
_
set
使用详解...
有这么一需求,在
Hive
中求出一个数据表中在某天内首次登陆的人;可以借助
collect
_
set
来处理sql:[html]...
赞
踩
article
Hive
/
ClickHouse
行转列函数
collect
_set() / groupUniqA...
以上就是在
Hive
和
ClickHouse
中使用
collect
_set() 和
groupUniqArray
()...
赞
踩
article
[
hive
]
collect
_
set
排序
问题_
collect
set
排序
...
即:
collect
_
set
(a) over(partition by b order by c) 集合中的数据a会按照 ...
赞
踩
article
hive
列转行—
collect
_
set
()/
collect
_
list
()/
concat
_
ws
()函...
【
hive
】列转行—
collect
_
set
()/
collect
_
list
()/
concat
_
ws
()函数的使用场景_hi...
赞
踩
article
Hive
SQL常用
函数
...
Hive
SQL常用
函数
Hive
SQL常用
函数
一、日期
函数
...
赞
踩
article
Hive
SQL 中ARRAY或MAP类型数据处理:
lateral
view
explode
()/p...
在对表数据进行批量处理过程中,常常碰上某个字段是一个array或者map形式的字段,一列数据的该字段信息同时存在多个值,...
赞
踩
article
Hive
SQL
函数
相关资料
的
整理...
一、
函数
搜集《
Hive
常用
函数
大全一览》来源:https://www.iteblog.com/archives/2258...
赞
踩
article
Hive
SQL
窗口
函数...
本文首发:大数据每日哔哔-
Hive
SQL
窗口
函数
Hive
的
窗口
函数在 SQL 中有一类函数叫做聚合函数,例如 su...
赞
踩
article
Hive
SQL自带
函数
总结_
sql
array
长度
get
array
length
...
字符串长度
函数
:
length
语法:
length
(string A) 返回值: int 说明:返回字符串A的长度 举例...
赞
踩
article
hive
sql常用
函数
...
分析
函数
名(参数) OVER (PARTITION BY 子句 ORDER BY 子句 ROWS/RANGE 子句)。如...
赞
踩
article
【
Hive
】SQL
数据结构
&
常用
函数
_
hive
tostring
...
【
Hive
】SQL
常用
函数
及 自定义
函数
_
hive
tostring
hive
tostring
...
赞
踩
相关标签
hive
数据仓库
大数据
sql
hadoop
big data
scrapy
spark
apache
hive on spark
python
clickhouse