字符串处理技巧：判断回文和 split 实现

2024-02-21 10:09:42

深挖字符串类：探秘 split() 的秘密花园

字符串操作是编程中的基本功，而 split() 方法更是处理字符串时的必备利器。它能够将一个字符串按照指定的分割符拆分为一个个子字符串，为我们带来了极大的便利。今天，我们就将掀开 split() 的面纱，一探其内部究竟。

单词回文的便捷判断

判断一个单词是否是回文（正反读都一样）是一个经典的字符串处理问题。我们先从一个简单的方法入手：

常规方法： 遍历字符串，从头和尾向中间比较，如果始终相等，则为回文。

更优方法： 利用 Python 的切片特性，将字符串与它的反转进行比较。

def is_palindrome(word):
    return word == word[::-1]

初探 split() 的实现

split() 的使命是将字符串按照指定的分割符分割成列表。让我们来探索它的初版实现：

def split(string, delimiter):
    parts = []
    start = 0
    while start < len(string):
        end = string.find(delimiter, start)
        if end == -1:  # 未找到分隔符
            parts.append(string[start:])
            break
        else:
            parts.append(string[start:end])
            start = end + len(delimiter)
    return parts

思路：

初始化一个空列表 parts，用于存储分割后的部分。
从字符串的开头开始查找分隔符。
如果找到分隔符，则将字符串从开始位置到分隔符之前的位置添加到 parts 中。
将开始位置更新为分隔符之后的位置。
循环继续，直到找到所有分隔符。

局限性：

没有处理空字符串或连续分隔符的情况。
效率不高，需要多次遍历字符串。

优化后的 split() 实现

为了提高效率，我们可以采用更优化的算法：

import re

def split_optimized(string, delimiter):
    parts = re.split(delimiter, string)
    if parts[-1] == '':  # 去除结尾的空字符串
        parts = parts[:-1]
    return parts

正则表达式：

re.split(delimiter, string) 函数使用正则表达式 delimiter 将字符串分割成列表。

优化：