首页
/ 正文

PostgreSQL GROUP BY 语句（长文讲解）

更新时间: 2025-04-16 14:26:40

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战(已更新的所有项目都能学习) / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新开坑项目:《Spring AI 项目实战》 正在持续爆肝中，基于 Spring AI + Spring Boot 3.x + JDK 21...， 点击查看 ;

《从零手撸：仿小红书（微服务架构）》 已完结，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 100w+ 字，讲解图 4013+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3700+ 小伙伴加入学习，欢迎点击围观

前言

在数据处理的世界中，如何高效地将海量信息归纳为有意义的结论，是开发者需要掌握的核心技能之一。PostgreSQL 的 GROUP BY 语句正是实现这一目标的利器。它如同数据海洋中的“分类器”，能够将数据按特定规则分组，再通过聚合函数提炼关键信息。无论是统计用户行为、分析销售数据，还是优化数据库查询性能，GROUP BY 都是不可或缺的工具。本文将从基础概念出发，结合实际案例和代码示例，深入解析 GROUP BY 的使用场景与技巧，帮助读者在实际开发中灵活运用这一功能。

GROUP BY 的基础概念与语法

什么是 GROUP BY？

想象你是一家书店的店长，需要统计不同分类书籍的销售情况。手动逐条记录显然低效，而 GROUP BY 正好能帮你快速完成这项任务。它的工作原理是：将数据表按指定列的值进行分组，每组作为一个逻辑单元，再对每组应用聚合函数（如 COUNT、SUM 等）生成汇总结果。

语法结构如下：

SELECT 列1, 聚合函数(列2), ...  
FROM 表名  
WHERE 条件  
GROUP BY 列1;

为什么需要聚合函数？

GROUP BY 必须与聚合函数结合使用，因为分组后，单条记录的细节会被“隐藏”，只剩组的统计信息。例如：

COUNT(*)：统计每组的总行数。
SUM(销售额)：计算每组销售额的总和。
AVG(价格)：求每组价格的平均值。

示例：
假设有一个 sales 表，包含 category（分类）、revenue（销售额）两列，要统计每个分类的总销售额：

SELECT category, SUM(revenue) AS total_revenue  
FROM sales  
GROUP BY category;

GROUP BY 的核心应用场景

场景 1：按单一列分组

最基础的用法是按单一列分组，例如统计不同部门的员工人数：

示例表：employees
| id | name | department | salary |
|----|-------|------------|--------|
| 1 | Alice | Sales | 5000 |
| 2 | Bob | HR | 4500 |
| 3 | Charlie | Sales | 6000 |

查询代码：

SELECT department, COUNT(*) AS employee_count  
FROM employees  
GROUP BY department;

输出结果：
| department | employee_count |
|------------|----------------|
| Sales | 2 |
| HR | 1 |

场景 2：结合 HAVING 筛选分组结果

HAVING 是 GROUP BY 的“筛选器”，用于过滤不符合条件的组。例如，筛选员工人数超过 1 的部门：

查询代码：

SELECT department, COUNT(*) AS employee_count  
FROM employees  
GROUP BY department  
HAVING COUNT(*) > 1;

输出结果：
| department | employee_count |
|------------|----------------|
| Sales | 2 |

场景 3：多列分组与嵌套逻辑

当需要更细粒度的统计时，可以按多列分组。例如，统计各部门不同职位的平均薪资：

示例表扩展：employees 新增 position 列
| id | name | department | position | salary |
|----|-------|------------|----------|--------|
| 1 | Alice | Sales | Manager | 5000 |
| 2 | Bob | HR | Analyst | 4500 |
| 3 | Charlie | Sales | Engineer | 6000 |

查询代码：

SELECT department, position, AVG(salary) AS avg_salary  
FROM employees  
GROUP BY department, position;

输出结果：
| department | position | avg_salary |
|------------|-----------|------------|
| Sales | Manager | 5000 |
| HR | Analyst | 4500 |
| Sales | Engineer | 6000 |

进阶技巧与常见问题

技巧 1：使用 WITH 子句简化复杂查询

当分组逻辑涉及多层计算时，WITH 子句（Common Table Expressions, CTE）能提升可读性。例如，先计算每个用户的订单总金额，再按地区分组统计：

WITH user_orders AS (  
    SELECT user_id, SUM(amount) AS total_spent  
    FROM orders  
    GROUP BY user_id  
)  
SELECT region, COUNT(*) AS active_users, AVG(total_spent) AS avg_spend  
FROM user_orders  
JOIN users ON user_orders.user_id = users.id  
GROUP BY region;

技巧 2：GROUP BY 与窗口函数的区别

窗口函数（如 ROW_NUMBER()、RANK()）与 GROUP BY 的核心区别在于：

GROUP BY：将数据分组后，每组返回一条汇总记录。
窗口函数：在保留原始行的基础上，为每行添加计算值（如排名、滚动平均值）。

例如，统计各部门员工薪资排名：

SELECT name, department, salary,  
       ROW_NUMBER() OVER (PARTITION BY department ORDER BY salary DESC) AS rank  
FROM employees;

输出结果：
| name | department | salary | rank |
|---------|------------|--------|------|
| Charlie | Sales | 6000 | 1 |
| Alice | Sales | 5000 | 2 |
| Bob | HR | 4500 | 1 |

常见错误与解决方案

非聚合列未包含在 GROUP BY 中：
若查询字段中包含未聚合的列（如 SELECT department, name），PostgreSQL 会报错。需确保非聚合列均在 GROUP BY 列表中，或使用聚合函数（如 MAX(name)）。
分组顺序影响结果：
GROUP BY 的结果默认无顺序，若需排序，应显式添加 ORDER BY 子句。

实战案例：电商销售分析

案例背景

假设我们有一个电商平台的 orders 表，结构如下：
| order_id | product_category | region | order_date | revenue |
|----------|------------------|--------|------------|---------|
| 101 | Electronics | North | 2023-01-15 | 200 |
| 102 | Books | South | 2023-01-16 | 150 |
| ... | ... | ... | ... | ... |

需求 1：按季度统计各区域销售额

SELECT  
    TO_CHAR(order_date, 'YYYY-Q') AS quarter,  
    region,  
    SUM(revenue) AS total_revenue  
FROM orders  
GROUP BY  
    TO_CHAR(order_date, 'YYYY-Q'),  
    region  
ORDER BY quarter, region;

需求 2：筛选季度销售额超过 1000 的区域

SELECT  
    TO_CHAR(order_date, 'YYYY-Q') AS quarter,  
    region,  
    SUM(revenue) AS total_revenue  
FROM orders  
GROUP BY  
    TO_CHAR(order_date, 'YYYY-Q'),  
    region  
HAVING SUM(revenue) > 1000  
ORDER BY quarter DESC;

需求 3：计算每个产品的平均月销售额

SELECT  
    product_category,  
    DATE_TRUNC('month', order_date) AS month,  
    AVG(revenue) AS avg_monthly_revenue  
FROM orders  
GROUP BY product_category, DATE_TRUNC('month', order_date)  
ORDER BY product_category, month;

结论

通过本文的讲解，我们看到 PostgreSQL GROUP BY 语句在数据聚合、统计分析中的强大功能。它不仅是 SQL 开发的基石，更是从数据中提炼洞见的关键工具。无论是统计基础指标、优化查询性能，还是构建复杂分析模型，掌握 GROUP BY 的使用逻辑与技巧，都将显著提升开发效率。

建议读者通过实际操作加深理解：创建自己的测试表，尝试不同分组组合，观察结果变化。随着经验积累，你将能灵活运用 GROUP BY 解决更复杂的业务问题，让数据真正成为驱动决策的核心力量。

PostgreSQL GROUP BY 语句（长文讲解）

前言

GROUP BY 的基础概念与语法

什么是 GROUP BY？

为什么需要聚合函数？

GROUP BY 的核心应用场景

场景 1：按单一列分组

场景 2：结合 HAVING 筛选分组结果

场景 3：多列分组与嵌套逻辑

进阶技巧与常见问题

技巧 1：使用 WITH 子句简化复杂查询

技巧 2：GROUP BY 与窗口函数的区别

常见错误与解决方案

实战案例：电商销售分析

案例背景

需求 1：按季度统计各区域销售额

需求 2：筛选季度销售额超过 1000 的区域

需求 3：计算每个产品的平均月销售额

结论

最新发布

Clion 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

RubyMine 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Rider 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

GoLand 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Pycharm 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

PhpStorm 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Webstorm 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

IDEA 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Pycharm 2026.1.3 最新激活码，破解版安装教程（亲测至2099年）

Rider 2026.1.3 最新激活码，破解版安装教程（亲测至2099年）