赞
踩
GROUP BY
GROUP BY 是一个SQL子句,用于将结果集按一个或多个列进行分组,然后对每个组应用聚合函数(如 SUM, COUNT, AVG 等)。它会改变查询的结果集,使其只包含每个组的汇总信息。
例如:
sql
SELECT employee_id, SUM(amount)
FROM sales
GROUP BY employee_id;
这个查询会返回每个 employee_id 对应的 amount 的总和。
PARTITION BY
PARTITION BY 是窗口函数的一部分,用于定义窗口(即数据分区),但是它不会改变结果集的行数。相反,它会在指定的窗口内计算聚合值或排名等,并将这些值附加到每一行中去。
例如:
sql
SELECT
employee_id,
amount,
SUM(amount) OVER (PARTITION BY employee_id) AS totalAmount
FROM
sales;
这个查询会返回每一行,并在每一行中增加一个列 totalAmount,它表示的是该 employee_id 内所有 amount 的总和。
区别
功能:GROUP BY 用于分组并返回每组的聚合结果。PARTITION BY 用于窗口函数内,将结果集划分为几个分区,计算聚合值或其他窗口函数。
结果集:GROUP BY 改变结果集的行数,只返回每组一行。PARTITION BY 不改变结果集的行数,而是在原始结果集中增加计算列。
例子对比
假设有一个表 sales:
employee_id amount
1 100
1 150
2 200
2 250
使用 GROUP BY:
sql
SELECT employee_id, SUM(amount) AS totalAmount
FROM sales
GROUP BY employee_id;
结果:
employee_id totalAmount
1 250
2 450
使用 PARTITION BY:
sql
SELECT
employee_id,
amount,
SUM(amount) OVER (PARTITION BY employee_id) AS totalAmount
FROM
sales;
结果:
employee_id amount totalAmount
1 100 250
1 150 250
2 200 450
2 250 450
总结:
GROUP BY 用于分组和聚合,改变结果集的结构。
PARTITION BY 用于窗口函数,增加计算列,不改变结果集的结构。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。