Heap 数据结构：通往数据处理之巅

前端

2024-01-06 09:14:04

在计算机科学的浩瀚世界中，树形数据结构占据着举足轻重的地位。作为一种特殊类型的树，堆的数据结构以其独到的魅力而著称。它将数据处理提升到一个新的高度，为各种复杂问题提供优雅的解决方案。

堆的内部机制

堆是一种特殊的完全二叉树，具有严格的性质：

根节点最小（或最大）： 与二分搜索树类似，堆的根节点始终是其中最小或最大的元素。
最大子堆： 任何非根节点的两个子节点都比其父节点小或大。

这些性质赋予堆独特的优势：

快速查找： 根节点包含最小或最大元素，因此查找操作只需一次比较。
快速插入和删除： 利用堆的性质，可以高效地插入或删除元素，同时保持其有序性。

堆的应用

堆在计算机科学中扮演着至关重要的角色。其广泛的应用领域包括：

优先级队列： 堆可以充当优先级队列，优先处理最小的或最大的元素。
排序： 堆排序算法利用堆的性质对数据进行排序，效率较高。
哈夫曼编码： 堆在哈夫曼编码中用于构建最优二叉树，压缩数据。

封装专属 Heap

为了充分利用堆的优势，我们可以封装一个专属的 Heap 类。该类需要实现以下基本操作：

insert(val)：插入一个元素。
extract_min()：移除并返回最小元素。
change_priority(val, new_priority)：改变一个元素的优先级。

示例代码

以下是用 Python 封装的 Heap 类示例：

class Heap:
    def __init__(self, is_min_heap=True):
        self.heap = []
        self.is_min_heap = is_min_heap

    def __len__(self):
        return len(self.heap)

    def __repr__(self):
        return f"Heap({self.heap})"

    def insert(self, val):
        self.heap.append(val)
        self._heapify_up(len(self.heap) - 1)

    def _heapify_up(self, idx):
        parent = (idx - 1) // 2
        if parent >= 0 and self.compare(idx, parent):
            self.heap[idx], self.heap[parent] = self.heap[parent], self.heap[idx]
            self._heapify_up(parent)

    def extract_min(self):
        if not self.heap:
            return None
        val = self.heap[0]
        self.heap[0] = self.heap[-1]
        self.heap.pop()
        self._heapify_down(0)
        return val

    def _heapify_down(self, idx):
        smallest = idx
        left, right = 2 * idx + 1, 2 * idx + 2
        if left < len(self.heap) and self.compare(left, smallest):
            smallest = left
        if right < len(self.heap) and self.compare(right, smallest):
            smallest = right
        if smallest != idx:
            self.heap[idx], self.heap[smallest] = self.heap[smallest], self.heap[idx]
            self._heapify_down(smallest)

    def compare(self, idx1, idx2):
        if self.is_min_heap:
            return self.heap[idx1] < self.heap[idx2]
        else:
            return self.heap[idx1] > self.heap[idx2]