探寻LeetCode中676题的解决方案：用字典树和深度优先搜索构建魔法词典

2024-02-21 13:50:11

魔法字典：在算法竞赛和编程面试中实现一个词典，允许一个字符的错误

在算法竞赛和编程面试中，我们经常会遇到一些涉及单词查询和匹配的问题，而 LeetCode 676: 实现一个魔法字典就是其中一个经典题目。在本文中，我们将共同探讨如何利用字典树数据结构和深度优先搜索算法来解决这个问题，创建一个神奇的字典，它可以允许一个字符的错误，并在搜索过程中快速找到匹配的单词。

1. 问题

想象一下你是一个语言学家，正在研究一种拥有数百万个单词的语言。为了方便你的研究，你决定创建一个字典，以便快速查询和匹配单词。但这个字典并非普通字典，它是一个“魔法字典”，允许在搜索单词时出现一个字符的错误。

举个例子，假设你的字典中包含 "hello" 这个单词。如果有人向你查询 "hallo" 或 "hell"，你仍然应该返回 true，因为它们与 "hello" 只有一个字符的差异。

2. 解决思路：字典树

为了实现这个魔法字典，我们可以采用字典树（也称为前缀树或 Trie）数据结构。字典树是一种树形结构，其中每个结点代表一个字母，而从根结点到叶结点的路径则代表一个单词。

我们先来构建字典树。对于单词列表中的每个单词，我们从根结点开始，逐个字符地向下移动。如果遇到不存在的结点，则创建一个新的结点。当我们到达单词的最后一个字符时，我们将该结点标记为叶结点。

举个例子，让我们将单词 "hello" 插入到字典树中。首先，我们在根结点下创建结点 "h"。然后，我们在 "h" 结点下创建结点 "e"，在 "e" 结点下创建结点 "l"，在 "l" 结点下创建结点 "l"，最后在 "l" 结点下创建结点 "o"，并将其标记为叶结点。

3. 深度优先搜索

构建完字典树后，我们就可以使用深度优先搜索算法来进行搜索。从根结点开始，我们将逐个字符地向下移动，并在每个结点处检查当前字符是否与搜索单词的当前字符匹配。

如果匹配，我们将继续向下移动；如果不匹配，我们将回溯到上一个结点并尝试另一个分支。

在深度优先搜索过程中，当我们遇到一个叶结点时，我们将检查该叶结点的单词是否与搜索单词相同。如果相同，则返回 true；如果不相同，则继续搜索。

举个例子，让我们在字典树中搜索单词 "hallo"。我们将从根结点开始，逐个字符地向下移动。在第一个结点处，我们将检查字符 "h" 是否与 "hallo" 的第一个字符 "h" 匹配。匹配后，我们将继续向下移动到 "a" 结点。接下来，我们将检查字符 "a" 是否与 "hallo" 的第二个字符 "a" 匹配。匹配后，我们将继续向下移动到 "l" 结点。

在 "l" 结点处，我们将检查字符 "l" 是否与 "hallo" 的第三个字符 "l" 匹配。匹配后，我们将继续向下移动到另一个 "l" 结点。最后，我们将检查字符 "o" 是否与 "hallo" 的第四个字符 "o" 匹配。匹配后，我们将到达一个叶结点。

接下来，我们将检查叶结点的单词是否与 "hallo" 相同。显然，叶结点的单词是 "hello"，与 "hallo" 不同。因此，我们将返回 false。

4. 代码实现

class TrieNode:
    def __init__(self):
        self.children = {}
        self.is_word = False


class MagicDictionary:

    def __init__(self):
        self.root = TrieNode()

    def buildDict(self, dict):
        for word in dict:
            self.insert(word)

    def insert(self, word):
        current = self.root
        for char in word:
            if char not in current.children:
                current.children[char] = TrieNode()
            current = current.children[char]
        current.is_word = True

    def search(self, word):
        return self.dfs(word, self.root, 0, False)

    def dfs(self, word, current, index, has_error):
        if index == len(word):
            return current.is_word and has_error

        char = word[index]
        if char in current.children:
            if self.dfs(word, current.children[char], index + 1, has_error):
                return True
            if not has_error:
                for child in current.children:
                    if child != char and self.dfs(word, current.children[child], index + 1, True):
                        return True
        return False