递归征服复杂查询：探索 PostgreSQL 中的树形结构之美

2024-01-02 21:56:03

当我们面对不确定深度的层级结构时，如组织机构，一种常用的设计是在一张表中保存 ID 和 Parent_ID 字段，并通过自联结的方式构造一颗树。这种方式对数据写入十分友好，但查询过程却变得相对复杂。在不引入 MPTT 模型的前提下，必须通过递归算法来查询某个节点及其下级子节点。

递归查询的魅力

递归查询是一种通过不断地重复相同的操作来解决问题的算法，非常适合处理具有层级结构的数据。在 PostgreSQL 中，我们可以使用 WITH RECURSIVE 语句来编写递归查询，其基本语法如下：

WITH RECURSIVE <递归公共表表达式名称> AS (
    <初始查询>
    UNION ALL
    <递归查询>
)

SELECT *
FROM <递归公共表表达式名称>;

祖先查询

让我们从一个简单的例子开始。假设我们有一个名为 employees 的表，其中包含员工的 ID、姓名和上级 ID 字段。现在，我们要查询所有员工及其祖先。我们可以使用以下递归查询：

WITH RECURSIVE EmployeeHierarchy AS (
    SELECT
        e.id,
        e.name,
        e.manager_id
    FROM
        employees AS e
    WHERE
        e.manager_id IS NULL
    UNION ALL
    SELECT
        e.id,
        e.name,
        e.manager_id
    FROM
        employees AS e
    INNER JOIN
        EmployeeHierarchy AS eh
    ON
        e.manager_id = eh.id
)

SELECT *
FROM EmployeeHierarchy;

该查询首先找到所有没有上级的员工（即最顶层的员工），然后递归地找到这些员工的子级员工，依次类推，直到找到所有员工及其祖先。

层级数据检索

除了祖先查询，递归查询还可以用于检索层级数据。例如，我们想查询所有销售部门及其子部门的员工，我们可以使用以下递归查询：

WITH RECURSIVE DepartmentHierarchy AS (
    SELECT
        d.id,
        d.name,
        d.parent_id
    FROM
        departments AS d
    WHERE
        d.parent_id IS NULL
    UNION ALL
    SELECT
        d.id,
        d.name,
        d.parent_id
    FROM
        departments AS d
    INNER JOIN
        DepartmentHierarchy AS dh
    ON
        d.parent_id = dh.id
)

SELECT *
FROM DepartmentHierarchy;