从零开始理解堆排序：直观解释+代码演示

人工智能

2023-09-29 02:48:39

前言

排序是计算机科学中一项基本操作，广泛应用于数据处理、数据库管理和机器学习等领域。堆排序是一种高效的排序算法，以其速度和稳定性而备受推崇。本文旨在通过直观的解释和代码演示，带领您从零开始深入理解堆排序的原理和实现。

堆排序简介

堆排序是一种基于二叉堆（一种特殊的完全二叉树）的数据结构的排序算法。堆具有以下特性：

最大堆： 每个节点的值都大于或等于其子节点的值。
最小堆： 每个节点的值都小于或等于其子节点的值。

堆排序通过将输入数据构建成一个最大堆，然后逐个交换堆顶元素（最大元素）和最后一个元素，并将最后一个元素从堆中移除，以此重复构建堆的过程，最终得到一个有序的数组。

堆排序算法

堆排序算法的具体步骤如下：

将输入数组构建成一个最大堆。
交换堆顶元素（最大元素）和最后一个元素。
将最后一个元素从堆中移除。
对剩余的堆重新构建最大堆。
重复步骤2-4，直到堆中只剩下一个元素。

代码演示

Python

def heap_sort(arr):
    """
    堆排序算法

    参数：
        arr：待排序数组

    返回：
        排序后的数组
    """

    # 构建最大堆
    for i in range(len(arr) // 2 - 1, -1, -1):
        heapify(arr, i, len(arr))

    # 依次取出堆顶元素并重建堆
    for i in range(len(arr) - 1, 0, -1):
        arr[i], arr[0] = arr[0], arr[i]
        heapify(arr, 0, i)

    return arr


def heapify(arr, i, n):
    """
    维护最大堆性质

    参数：
        arr：待排序数组
        i：当前节点索引
        n：堆大小
    """

    largest = i
    left = 2 * i + 1
    right = 2 * i + 2

    # 找出最大值及其索引
    if left < n and arr[left] > arr[largest]:
        largest = left

    if right < n and arr[right] > arr[largest]:
        largest = right

    # 交换最大值和当前值
    if largest != i:
        arr[i], arr[largest] = arr[largest], arr[i]

        # 继续维护子堆的最大堆性质
        heapify(arr, largest, n)

JavaScript

function heapSort(arr) {
  // 构建最大堆
  for (let i = Math.floor(arr.length / 2) - 1; i >= 0; i--) {
    heapify(arr, i, arr.length);
  }

  // 依次取出堆顶元素并重建堆
  for (let i = arr.length - 1; i > 0; i--) {
    [arr[i], arr[0]] = [arr[0], arr[i]];
    heapify(arr, 0, i);
  }

  return arr;
}

function heapify(arr, i, n) {
  // 找出最大值及其索引
  let largest = i;
  let left = 2 * i + 1;
  let right = 2 * i + 2;

  if (left < n && arr[left] > arr[largest]) {
    largest = left;
  }

  if (right < n && arr[right] > arr[largest]) {
    largest = right;
  }

  // 交换最大值和当前值
  if (largest !== i) {
    [arr[i], arr[largest]] = [arr[largest], arr[i]];

    // 继续维护子堆的最大堆性质
    heapify(arr, largest, n);
  }
}