堆排序：深入解析其强大功能

见解分享

2024-02-13 20:37:57

堆排序：一种高效的选择排序算法

堆排序是一种选择排序算法，利用堆这种数据结构来实现。堆是一种具有特定性质的完全二叉树，其中每个节点的值都大于或等于其左右子节点的值，称为大顶堆。

堆排序算法的原理：

堆排序算法主要包括以下步骤：

建堆： 将输入数据构建成一个大顶堆。
出队： 从大顶堆中取出堆顶元素，即最大元素。
入队： 将剩下的元素重新调整为一个大顶堆，重复步骤 2，直到堆中只剩一个元素。

堆化过程：

建堆和重新调整堆的过程中需要用到堆化操作。堆化是一种将一棵子树调整为大顶堆的操作，具体步骤如下：

比较子树根节点与左右子节点，选择最大值。
如果子节点中存在最大值，与子树根节点交换位置。
对交换后的子树再次执行堆化操作。

堆排序的时间复杂度：

堆排序算法的时间复杂度与堆化操作密切相关。建堆和重新调整堆的时间复杂度均为 O(nlogn)，因此堆排序算法的最坏、最好、平均时间复杂度均为 O(nlogn)。

堆排序的优点：

时间复杂度为 O(nlogn)，在大多数情况下效率较高。
空间复杂度为 O(1)，不需要额外的空间。
适用于各种数据类型。

堆排序的缺点：

不是稳定排序算法，即相同元素可能不保持其原始顺序。
需要额外的空间来存储堆结构。

堆排序代码示例：

def heap_sort(arr):
    """堆排序算法

    Args:
        arr (list): 需要排序的列表

    Returns:
        list: 排序后的列表
    """

    # 建立大顶堆
    for i in range(len(arr) // 2 - 1, -1, -1):
        heapify(arr, i, len(arr))

    # 堆排序
    for i in range(len(arr) - 1, 0, -1):
        # 交换堆顶元素和最后一个元素
        arr[i], arr[0] = arr[0], arr[i]
        # 对剩余元素堆化
        heapify(arr, 0, i)

    return arr


def heapify(arr, i, n):
    """堆化操作

    Args:
        arr (list): 需要堆化的列表
        i (int): 子树根节点索引
        n (int): 子树大小
    """

    largest = i  # 假设根节点是最大的
    left = 2 * i + 1  # 左子树索引
    right = 2 * i + 2  # 右子树索引

    # 检查左子树是否大于根节点
    if left < n and arr[left] > arr[largest]:
        largest = left

    # 检查右子树是否大于根节点
    if right < n and arr[right] > arr[largest]:
        largest = right

    # 如果根节点不是最大的，则交换位置并堆化子树
    if largest != i:
        arr[i], arr[largest] = arr[largest], arr[i]
        heapify(arr, largest, n)