怎样在 MySQL 表中存储树形结构数据？-CDA数据分析师官网

热线电话：13121318867

怎样在 MySQL 表中存储树形结构数据？

2023-03-22

树形结构数据是一种常见的数据结构，它由节点和边组成，可以用来表示层次化的关系。在MySQL表中存储树形结构数据，可以使用多种方法，本文将简要介绍几种主要的方法。

Adjacency List Model 邻接列表模型是存储树形结构数据最基本的方法之一。这种方法是将每个节点存储为一行，并包含其父节点的ID。例如，假设我们有一个表示部门层次结构的树形结构：

公司
- 技术部
  - 开发团队
  - 测试团队
- 销售部
  - 区域销售团队
  - 在线销售团队

我们可以使用以下表格来存储此树形结构：

dept_id | name                 | parent_id
--------|----------------------|----------
1       | 公司                | NULL
2       | 技术部            | 1
3       | 开发团队        | 2
4       | 测试团队        | 2
5       | 销售部            | 1
6       | 区域销售团队 | 5
7       | 在线销售团队 | 5

其中，dept_id 是节点的唯一标识符，name 是节点名称，parent_id 是父节点的 dept_id。如果一个节点没有父节点，则其 parent_id 值为 NULL。

优点：邻接列表模型是非常简单和直观的模型，易于理解和实现。缺点：查询复杂度高，特别是递归查询。

Path Enumeration Model 路径枚举模型是另一种存储树形结构数据的方法。这种方法是将每个节点存储为一行，同时包含其祖先节点的完整路径。例如，在前面的例子中，路径枚举模型下的表格如下所示：

dept_id | name                 | path
--------|----------------------|---------
1       | 公司                | 1
2       | 技术部            | 1/2
3       | 开发团队        | 1/2/3
4       | 测试团队        | 1/2/4
5       | 销售部            | 1/5
6       | 区域销售团队 | 1/5/6
7       | 在线销售团队 | 1/5/7

在此模型中，每个节点都有一个唯一标识符dept_id，名称name和path，该路径包含其所有祖先节点的dept_id，以斜杠分隔。例如，技术部门的路径为1/2，其祖先为公司（dept_id为1）。

优点：查询效率高，对于子节点查询，只需要使用LIKE操作符即可。缺点：更新节点时，需要更新其后代节点的路径。

Nested Set Model 嵌套集合模型是存储树形结构数据的另一种流行方法，它为每个节点分配左右值。例如，在前面的例子中，嵌套集合模型下的表格如下所示：

dept_id | name                 | lft | rgt
--------|----------------------|-----|-----
1       | 公司                | 1   | 14
2       | 技术部            | 2   | 7
3       | 开发团队        | 3   | 4
4       | 测试团队        | 5   | 6
5       | 销售部            | 8   | 13
6       | 区域销售团队 | 9   | 10
7       | 在线销售团队 | 11  | 12

在此模型中，

每个节点都有一个唯一标识符dept_id，名称name，以及左右值lft和rgt。左右值的定义是这样的：假设一个节点有子节点，则其左值是其第一个子节点的左值减1，右值是其最后一个子节点的右值加1。如果一个节点没有子节点，则其左值和右值相等。

优点：查询效率高，递归查询时不需要使用JOIN操作，只需要使用BETWEEN操作即可。缺点：更新节点时，需要更新许多左右值。

Modified Preorder Tree Traversal (MPTT) Model 修改前序遍历树遍历（MPTT）模型是嵌套集合模型的改进版，它为每个节点分配左右值，还为每个节点分配了一个深度值。例如，在前面的例子中，MPTT模型下的表格如下所示：

dept_id | name                | lft | rgt | depth
--------|---------------------|-----|-----|-------
1       | 公司               | 1   | 14  | 0
2       | 技术部           | 2   | 7   | 1
3       | 开发团队       | 3   | 4   | 2
4       | 测试团队       | 5   | 6   | 2
5       | 销售部           | 8   | 13  | 1
6       | 区域销售团队 | 9   | 10  | 2
7       | 在线销售团队 | 11  | 12  | 2

在此模型中，每个节点都有一个唯一标识符dept_id，名称name，以及左右值lft、右值rgt和深度depth。与嵌套集合模型相比，MPTT模型额外提供了深度值，便于快速计算节点的层次关系。

优点：查询效率高，递归查询时不需要使用JOIN操作，只需要使用BETWEEN操作即可。缺点：更新节点时，需要更新许多左右值。

总结以上是几种常见的存储树形结构数据的方法。每种方法都有其优点和缺点，具体应用需根据具体场景而定。对于较深的树形结构，MPTT和嵌套集合模型可能比邻接列表和路径枚举模型更适合。但是，在更新节点时，MPTT和嵌套集合模型需要更新大量的值，因此在频繁更新节点的情况下，邻接列表和路径枚举模型可能更好。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；