深入解析 LeetCode 434：字符串中的单词数，掌握字符串处理技巧

见解分享

2023-09-13 19:42:06

字符串中的单词计数：高效实现技巧

在计算机科学中，单词计数是一项基本但至关重要的任务，它涉及计算给定文本中单词的数量。LeetCode 434 题目就是要求我们解决字符串中的单词计数问题。本文将深入探讨解决此问题的有效方法，包括循环法和正则表达式法的原理、实现和优化技巧。

单词计数的原理

单词计数的原理很简单：识别并统计文本中由一个或多个非空格字符组成的单词。单词之间的分隔符通常是空格或其他空白字符。为了准确计数，我们需要分离文本并应用适当的规则来定义单词。

循环法：逐字处理

循环法是单词计数最直接的方法。它遍历字符串的每个字符，识别非空格字符并累积单词计数。当遇到空格字符时，它会将单词计数器归零并开始计数下一个单词。这种方法易于理解和实现，但它的效率可能会受到字符串长度的影响。

正则表达式法：巧妙分割

正则表达式提供了一种更强大的方法来处理字符串。我们可以使用正则表达式 \s+ 匹配一个或多个空白字符，并将其替换为空格。这有效地将字符串分割成单词，然后我们可以轻松地计算单词的数量。这种方法通常比循环法更有效率，因为它只执行一次分割操作。

代码示例

以下是用 Python 和 Java 实现的循环法和正则表达式法的代码示例：

Python：

def count_words(s):
    # 循环法
    word_count = 0
    in_word = False
    for char in s:
        if char.isalpha():
            if not in_word:
                word_count += 1
                in_word = True
        else:
            in_word = False

    # 正则表达式法
    words = s.split()
    return len(words)

Java：

public class WordCount {

    public static int countWords(String s) {
        // 循环法
        int wordCount = 0;
        boolean inWord = false;
        for (char c : s.toCharArray()) {
            if (Character.isLetter(c)) {
                if (!inWord) {
                    wordCount++;
                    inWord = true;
                }
            } else {
                inWord = false;
            }
        }

        // 正则表达式法
        String[] words = s.split("\\s+");
        return words.length;
    }
}