深入浅出：排序链表中重复元素的巧妙剔除

2023-12-06 06:59:06

引子

在计算机编程领域，链表是一种常用的数据 structure，它由一系列按特定次序排列的结点组成，其中，结点包含数据和指向下一个结点引的址。在某些情况下，链表中可能存在重复的元素，这会影响数据的处理效率和存储空间的利用。本文将深入探討如何巧妙地剔除排序链表中的重复元素，为开发者提供一套系统且实操性强的解决方案。

算法原理

1. 单指针法

单指针法是一种简单有效的算法，其核心思想是使用一个指针逐个遍歷链表，并同时维护一个前驱指针。当发现当前结点与前一个结点相等时，则跳过当前结点，让前驱指针指向当前结的下一个结点。这种方法的时间复杂度为 O(n)，其中 n 表示链表的长度。

2. 哈希表法

哈希表法利用了哈希表的数据 structure 特性来实现重复元素的剔除。该算法的核心思想是将链表中的元素逐个哈希到哈希表中，当发现哈希表中已存在相同元素时，则跳过当前结点。哈希表法的时间复杂度也为 O(n)，但其空间复杂度为 O(n)，因为需要额外的空间来存储哈希表。

3. 快慢指针法

快慢指针法是一种较为巧妙的算法，它使用两个指针来解决重复元素问题。该算法的核心思想是使用一个慢指针和一个快指针，其中，慢指针每次移动一位，而快指针每次移动两位。当快指针遇到重复元素时，慢指针会随之移动一位，从而跳过重复元素。快慢指针法的时间复杂度和空间复杂度均为 O(n)，且无需额外的存储空间。

实现代码

1. 单指针法

def remove_duplicates_single_ptr(head):
    """
    使用单指针法移除排序链表中的重复元素

    Args:
        head (list node): 链表头结点

    Returns:
        list node: 去除重复元素之后的链表头结点
    """
    if not head:
        return head

    cur = head
    pre = None

    while cur:
        if pre and pre.val == cur.val:
            pre.next = cur.next
        else:
            pre = cur

        cur = cur.next

    return head

2. 哈希表法

def remove_duplicates_hashset(head):
    """
    使用哈希表法移除排序链表中的重复元素

    Args:
        head (list node): 链表头结点

    Returns:
        list node: 去除重复元素之后的链表头结点
    """
    if not head:
        return head

    hashset = set()
    cur = head
    pre = None

    while cur:
        if cur.val not in hashset:
            hashset.add(cur.val)
            if pre:
                pre.next = cur
            pre = cur
        else:
            pre.next = cur.next

        cur = cur.next

    return head

3. 快慢指针法

def remove_duplicates_two_ptr(head):
    """
    使用快慢指针法移除排序链表中的重复元素

    Args:
        head (list node): 链表头结点

    Returns:
        list node: 去除重复元素之后的链表头结点
    """
    if not head:
        return head

    fast = head
    low = head

    while fast:
        while fast and fast.val == low.val:
            fast = fast.next

        low.next = fast
        low = low.next

    return head