当前位置:   article > 正文

Mysql的聚合查询_mysql按省市统计业务

mysql按省市统计业务

聚合查询:

如果我们要统计一张表的数据量,例如,想查询students表一共有多少条记录,难道必须用SELECT * FROM students查出来然后再数一数有多少行吗?

这个方法当然可以,但是比较弱智。对于统计总数、平均数这类计算,SQL提供了专门的聚合函数,使用聚合函数进行查询,就是聚合查询,它可以快速获得结果。
仍然以查询students表一共有多少条记录为例,我们可以使用SQL内置的COUNT()函数查询:

SELECT COUNT(*) FROM students;
  • 1
  • 使用聚合查询并设置结果集的列名为num:

COUNT()表示查询所有列的行数,要注意聚合的计算结果虽然是一个数字,但查询的结果仍然是一个二维表,只是这个二维表只有一行一列,并且列名是COUNT()。
通常,使用聚合查询时,我们应该给列名设置一个别名,便于处理结果:


SELECT COUNT(*) num FROM students;
  • 1
  • 2
  • 常见聚合函数
    所有的UDAF(即聚合函数)都应该支持分组查询,内置的聚合函数有:

sum(列名) 求和      
max(列名) 最大值     
min(列名) 最小值     
avg(列名) 平均值     
first(列名)   第一条记录   
last(列名)    最后一条记录  
count(列名)   统计记录数   注意和count(*)的区别
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 聚合查询并设置WHERE条件

COUNT(*)和COUNT(id)实际上是一样的效果。另外注意,聚合查询同样可以使用WHERE条件,因此我们可以方便地统计出有多少男生、多少女生、多少80分以上的学生等:

SELECT COUNT(*) boys FROM students WHERE gender = 'M';
  • 1

除了COUNT()函数外,SQL还提供了如下聚合函数:

  • Group By
    谈到聚合查询必然会涉及group by

“Group By”从字面意义上理解就是根据“By”指定的规则对数据进行分组,所谓的分组就是将一个“数据集”划分成若干个“小区域”,然后针对若干个“小区域”进行数据处理。

聚合函数和分组查询结合在一起,可以更方便灵活地进行数据查询。

SELECT COUNT(*) boys FROM students GROUP BY age; 
  • 1
  • Having与Where
    where 子句的作用是在对查询结果进行分组前,将不符合where条件的行去掉,即在分组之前过滤数据,where条件中不能包含聚组函数,使用where条件过滤出特定的行。

having 子句的作用是筛选满足条件的组,即在分组之后过滤数据,条件中经常包含聚组函数,使用having 条件过滤出特定的组,也可以使用多个分组标准进行分组。

结合之前的文章,总结一下过滤的顺序

on->join->where->group by->having
  • 1

解释一下,on是在join之前,很容易理解,join要根据on的条件生成键进行MR计算,where对于发生在join 之后,因此where里的过滤条件不会减少数据输入量,不过分区限制会。group by会对where过滤后的数据分组并进行聚合,having则对聚合后的结果再进行过滤。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/986636
推荐阅读
相关标签
  

闽ICP备14008679号