精读《算法题 - 最小覆盖子串》深入解读难题

2023-09-04 14:38:14

破解“最小覆盖子串”难题：深入了解滑动窗口算法和双指针技术

子标题 1：什么是“最小覆盖子串”问题？

想象一下，你有一篇很长的文章和一个较短的单词列表。你的任务是找出文章中最短的片段，它包含单词列表中的所有单词。这就是著名的“最小覆盖子串”问题。它在编程面试中很常见，因为它测试了算法的效率和贪婪性。

子标题 2：滑动窗口算法

“滑动窗口”算法是一种贪心算法，顾名思义，它使用一个“窗口”在字符串中滑动，寻找满足特定条件的子串。在“最小覆盖子串”问题中，窗口的大小由单词列表的长度决定。窗口从文章的第一个字符开始，向后滑动，直到包含单词列表中的所有单词。当它满足这个条件时，窗口就会停止增长并记录它的位置。窗口继续向后滑动，直到达到文章的末尾。如果窗口不再包含单词列表中的所有单词，它的位置就会被记录下来，并更新为新的最小覆盖子串。

代码示例：

def minWindow(s, t):
    if len(t) > len(s):
        return ""

    # 创建一个哈希表来存储单词列表中的单词和它们出现的次数
    t_freq = {}
    for char in t:
        if char not in t_freq:
            t_freq[char] = 0
        t_freq[char] += 1

    # 创建一个哈希表来存储窗口中的单词和它们出现的次数
    s_freq = {}
    for char in s[:len(t)]:
        if char not in s_freq:
            s_freq[char] = 0
        s_freq[char] += 1

    # 初始化最小覆盖子串的长度和开始索引
    min_len = float('inf')
    start = 0

    # 滑动窗口
    for end in range(len(t), len(s) + 1):
        # 检查窗口是否包含单词列表中的所有单词
        if all(s_freq.get(char, 0) >= t_freq.get(char, 0) for char in t):
            # 更新最小覆盖子串的长度和开始索引
            if end - start < min_len:
                min_len = end - start
                start_idx = start

        # 更新窗口
        if end < len(s):
            s_freq[s[start]] -= 1
            start += 1
            s_freq[s[end]] += 1

    # 返回最小覆盖子串
    if min_len != float('inf'):
        return s[start_idx:start_idx + min_len]
    else:
        return ""

子标题 3：双指针技术

双指针技术是滑动窗口算法的一种优化。它使用两个指针来标记窗口的左右边界。当窗口不包含单词列表中的所有单词时，右指针向后移动，直到满足条件。当窗口包含单词列表中的所有单词时，左指针向后移动，直到不再满足条件。

代码示例：

def minWindow(s, t):
    if len(t) > len(s):
        return ""

    # 创建一个哈希表来存储单词列表中的单词和它们出现的次数
    t_freq = {}
    for char in t:
        if char not in t_freq:
            t_freq[char] = 0
        t_freq[char] += 1

    # 初始化左指针和右指针
    left = 0
    right = 0

    # 初始化最小覆盖子串的长度和开始索引
    min_len = float('inf')
    start = 0

    # 初始化窗口中单词列表中单词的计数
    t_count = 0

    # 滑动窗口
    while right < len(s):
        # 添加新字符到窗口
        if s[right] in t_freq:
            t_count += 1

        # 更新窗口
        right += 1

        # 检查窗口是否包含单词列表中的所有单词
        while t_count == len(t):
            # 更新最小覆盖子串的长度和开始索引
            if right - left < min_len:
                min_len = right - left
                start_idx = left

            # 从窗口中删除左指针指向的字符
            if s[left] in t_freq:
                t_count -= 1
            left += 1

    # 返回最小覆盖子串
    if min_len != float('inf'):
        return s[start_idx:start_idx + min_len]
    else:
        return ""