首頁手記并查集入門教程：原理與應用

并查集入門教程：原理與應用

標簽：

算法與數據結構

概述

并查集（Disjoint Set Union，简称DSU）是一种用于处理不相交集合的动态数据结构，主要用于判断元素是否属于同一个集合以及合并集合。并查集具有动态性、高效性和简洁性等特点，并通过路径压缩和按秩合并等优化技术提高操作效率。并查集在社交网络连接查询、图的连通性问题等多个领域都有广泛应用。

并查集简介

并查集的定义与用途

并查集（Disjoint Set Union，简称DSU）是一种用于处理不相交集合（即互不相交的集合）的动态数据结构。它主要用于解决以下问题：

判断两个元素是否属于同一个集合
合并两个集合

并查集通常用于处理具有动态变化的集合之间的关系问题。其核心思想是将问题简化为多个子问题，并逐级处理这些子问题，最终得到全局最优解。并查集不仅在理论研究方面有重要作用，而且在实际应用中也有广泛的应用，如社交网络中的连接查询、图的连通性问题等。

并查集的基本特点

并查集具有以下基本特点：

动态性：并查集支持动态添加和删除元素。
高效性：通过路径压缩和按秩合并等优化技术，使得并查集的操作在接近常数时间内完成。
简洁性：并查集的数据结构简单，易于实现和理解。

并查集的实现

父节点数组的初始化

并查集的核心数据结构是一个数组parent，数组的每个元素表示其子节点的父节点。初始化时，每个元素的父节点都指向其自身，表示每个元素单独构成一个集合。

def initialize(n):
    parent = [i for i in range(n)]
    return parent

查找根节点的操作

查找根节点的操作（即找到元素所属的集合的代表节点）是最基本的操作之一。通过递归地查找每个节点的父节点，直到找到根节点。

def find(x, parent):
    if parent[x] != x:
        parent[x] = find(parent[x], parent)
    return parent[x]

合并操作的实现

合并操作用于将两个集合合并为一个集合。通过将一个集合的根节点指向另一个集合的根节点来实现。

def union(x, y, parent, rank):
    root_x = find(x, parent)
    root_y = find(y, parent)
    if root_x != root_y:
        if rank[root_x] < rank[root_y]:
            parent[root_x] = root_y
        elif rank[root_x] > rank[root_y]:
            parent[root_y] = root_x
        else:
            parent[root_y] = root_x
            rank[root_x] += 1

并查集的优化

路径压缩技术

路径压缩（Path Compression）是一种优化技术，用于减少查找根节点的时间复杂度。当查找根节点的过程中，直接将路径上的所有节点的父节点指向根节点，使得路径变得扁平，下次查找时速度更快。

def find(x, parent):
    if parent[x] != x:
        parent[x] = find(parent[x], parent)  # 路径压缩
    return parent[x]

按秩合并策略

按秩合并（Union by Rank）是一种优化技术，用于减少合并集合时的树的高度。合并两个集合时，将秩较小的树根指向秩较大的树根。这种策略能保证树的高度较低，从而提高后续查找操作的效率。

def union(x, y, parent, rank):
    root_x = find(x, parent)
    root_y = find(y, parent)
    if root_x != root_y:
        if rank[root_x] < rank[root_y]:
            parent[root_x] = root_y
        elif rank[root_x] > rank[root_y]:
            parent[root_y] = root_x
        else:
            parent[root_y] = root_x
            rank[root_x] += 1

并查集的应用场景

社交网络中的连接查询

在社交网络中，可以通过并查集快速判断两个用户是否属于同一个社交圈。例如，给定用户列表users以及用户之间的朋友关系列表friends，可以使用并查集来实现连接查询。

def is_connected(user1, user2, parent):
    return find(user1, parent) == find(user2, parent)

users = [0, 1, 2, 3, 4]
friends = [(0, 1), (1, 2), (2, 3), (3, 4)]
parent = initialize(len(users))

for u, v in friends:
    union(u, v, parent, rank)

print(is_connected(0, 4, parent))  # 输出: True

图的连通性问题

在图的连通性问题中，可以使用并查集来快速判断图是否连通。给定一个图的顶点列表vertices和边列表edges，通过并查集可以实现图的连通性判断。

def is_connected_graph(vertices, edges):
    parent = initialize(len(vertices))
    rank = [0] * len(vertices)
    for u, v in edges:
        union(u, v, parent, rank)
    root_set = set()
    for v in vertices:
        root_set.add(find(v, parent))
    return len(root_set) == 1

vertices = [0, 1, 2, 3]
edges = [(0, 1), (1, 2), (2, 3)]
print(is_connected_graph(vertices, edges))  # 输出: True

动态维护集合的划分

在动态维护集合的划分问题中，可以通过并查集快速合并和查找集合。例如，给定一个元素列表elements以及一系列合并和查询操作，可以使用并查集来实现动态维护集合的划分。

def process_operations(elements, operations):
    n = len(elements)
    parent = initialize(n)
    rank = [0] * n
    for operation in operations:
        if operation[0] == 'union':
            union(operation[1], operation[2], parent, rank)
        elif operation[0] == 'find':
            print(find(operation[1], parent))

elements = [0, 1, 2, 3]
operations = [('union', 0, 1), ('union', 1, 2), ('find', 0)]
process_operations(elements, operations)  # 输出: 2

并查集的代码实现

Python实现示例

以下是一个完整的并查集的Python实现示例，包括初始化、查找和合并操作，以及路径压缩和按秩合并的优化。

class UnionFind:
    def __init__(self, n):
        self.parent = [i for i in range(n)]
        self.rank = [0] * n

    def find(self, x):
        if self.parent[x] != x:
            self.parent[x] = self.find(self.parent[x])
        return self.parent[x]

    def union(self, x, y):
        root_x = self.find(x)
        root_y = self.find(y)
        if root_x != root_y:
            if self.rank[root_x] < self.rank[root_y]:
                self.parent[root_x] = root_y
            elif self.rank[root_x] > self.rank[root_y]:
                self.parent[root_y] = root_x
            else:
                self.parent[root_y] = root_x
                self.rank[root_x] += 1

    def is_connected(self, x, y):
        return self.find(x) == self.find(y)

# 示例
uf = UnionFind(5)
uf.union(0, 1)
uf.union(1, 2)
uf.union(3, 4)
print(uf.is_connected(0, 4))  # 输出: False
print(uf.is_connected(0, 2))  # 输出: True

Java实现示例

以下是一个完整的并查集的Java实现示例，包括初始化、查找和合并操作，以及路径压缩和按秩合并的优化。

public class UnionFind {
    private int[] parent;
    private int[] rank;

    public UnionFind(int n) {
        parent = new int[n];
        rank = new int[n];
        for (int i = 0; i < n; i++) {
            parent[i] = i;
            rank[i] = 0;
        }
    }

    public int find(int x) {
        if (parent[x] != x) {
            parent[x] = find(parent[x]);
        }
        return parent[x];
    }

    public void union(int x, int y) {
        int rootX = find(x);
        int rootY = find(y);
        if (rootX != rootY) {
            if (rank[rootX] < rank[rootY]) {
                parent[rootX] = rootY;
            } else if (rank[rootX] > rank[rootY]) {
                parent[rootY] = rootX;
            } else {
                parent[rootY] = rootX;
                rank[rootX] += 1;
            }
        }
    }

    public boolean isConnected(int x, int y) {
        return find(x) == find(y);
    }

    public static void main(String[] args) {
        UnionFind uf = new UnionFind(5);
        uf.union(0, 1);
        uf.union(1, 2);
        uf.union(3, 4);
        System.out.println(uf.isConnected(0, 4));  // 输出: false
        System.out.println(uf.isConnected(0, 2));  // 输出: true
    }
}

练习与拓展

并查集相关问题的练习

以下是一些关于并查集的相关练习题，可以帮助你更好地理解和掌握并查集的使用。

题目一： 给定一个图的顶点列表vertices和边列表edges，判断该图是否连通。

示例：

vertices = [0, 1, 2, 3, 4]
edges = [(0, 1), (1, 2), (3, 4)]
print(is_connected_graph(vertices, edges))  # 输出: False

题目二： 给定一个元素列表elements以及一系列合并和查询操作，实现动态维护集合的划分。

示例：

elements = [0, 1, 2, 3]
operations = [('union', 0, 1), ('union', 1, 2), ('find', 0)]
process_operations(elements, operations)  # 输出: 2

深入理解并查集的变体

并查集有多种变体，例如带权并查集（Weighted Union-Find）和按秩合并优化的并查集（Union by Rank）。这些变体在特定的应用场景中可以提供更好的性能和灵活性。

带权并查集：在合并操作时，除了考虑秩之外，还需要考虑集合的权重。这种变体适用于需要考虑集合权重的应用场景。
按秩合并优化的并查集：通过按秩合并策略减少合并操作时的树的高度，进一步提高查找操作的效率。

通过深入理解并查集的不同变体，可以更好地应用并查集解决各种复杂问题。

點擊查看更多內容

為 TA 點贊

若覺得本文不錯，就分享一下吧！

評論

評論

共同學習，寫下你的評論

評論加載中...

展開查看更多評論

作者其他優質文章

正在加載中

郎朗坤

手記
篇

粉絲

49

獲贊與收藏

213

關注作者，訂閱最新文章

閱讀免費教程

后端通用面試教程

41個小節 32252 360

網絡編程入門教程

20個小節 13299 250

Pandas 入門教程

25個小節 19918 373

推薦

評論

收藏

共同學習，寫下你的評論



感謝您的支持，我會繼續努力的～

掃碼打賞，你說多少就多少

贊賞金額會直接到老師賬戶

支付方式

打開微信掃一掃，即可進行掃碼打賞哦

今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與放棄機會

點擊
抽獎

慕課手記新用戶專享福利

恭喜你，你的運氣太好了，居然抽中了 100個積分！

恭喜你，抽中了價值元的專欄！

太棒了，直接落到你賬戶里！

積分商城里的羅技鼠標、機械鍵盤、
Kindle 閱讀器、小米平衡車
Apple iPad （10.2英寸）、大額優惠券
在等著你去兌換了噢

作者：

免費贈送

兌換碼：1111222211 復制

優惠券可用于購買實戰課、體系課
無門檻使用

先去看看，有什么好東西馬上兌換我愛學習，選課去


亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空