一秒学会正则表达式之去除字符串中英文字母外的所有字符

前端

2023-08-12 04:56:34

深入理解正则表达式：去除字符串中英文字母外的所有字符

正则表达式是一种功能强大的工具，广泛应用于文本处理、数据分析和网络抓取等领域。它允许用户根据特定模式查找、替换和提取字符串。本文将深入探讨正则表达式，重点介绍如何去除字符串中英文字母外的所有字符。

正则表达式基础

正则表达式是一种特殊语法，用于字符串的搜索模式。其中一些常见的语法规则包括：

.： 匹配任何单个字符。
*： 匹配前一个字符零次或多次。
+： 匹配前一个字符一次或多次。
?： 匹配前一个字符零次或一次。
[]： 匹配指定范围内的字符。
[^]： 匹配不在指定范围内的字符。
\d： 匹配数字。
\w： 匹配字母、数字和下划线。
\s： 匹配空白字符。

去除英文字母外的字符

为了去除字符串中英文字母外的所有字符，我们可以使用正则表达式 [^a-zA-Z]。此正则表达式匹配所有非英文字母的字符。

下面是使用不同编程语言去除字符串中英文字母外的所有字符的代码示例：

Python：

import re

def remove_non_alphabetic_characters(string):
  return re.sub(r'[^a-zA-Z]', '', string)

string = "Hello, world! 123"
print(remove_non_alphabetic_characters(string))
# Output: "Hello world"

Java：

import java.util.regex.Pattern;

public class RemoveNonAlphabeticCharacters {

    public static String removeNonAlphabeticCharacters(String string) {
        return Pattern.compile("[^a-zA-Z]").matcher(string).replaceAll("");
    }

    public static void main(String[] args) {
        String string = "Hello, world! 123";
        System.out.println(removeNonAlphabeticCharacters(string));
        // Output: "Hello world"
    }
}

C++：

#include <iostream>
#include <regex>

using namespace std;

string remove_non_alphabetic_characters(string string) {
  regex pattern("[^a-zA-Z]");
  return regex_replace(string, pattern, "");
}

int main() {
  string string = "Hello, world! 123";
  cout << remove_non_alphabetic_characters(string) << endl;
  // Output: "Hello world"

  return 0;
}

JavaScript：

function removeNonAlphabeticCharacters(string) {
  return string.replace(/[^a-zA-Z]/g, "");
}

console.log(removeNonAlphabeticCharacters("Hello, world! 123"));
// Output: "Hello world"

C#：

using System.Text.RegularExpressions;

public class RemoveNonAlphabeticCharacters {

    public static string RemoveNonAlphabeticCharacters(string string) {
        return Regex.Replace(string, "[^a-zA-Z]", "");
    }

    public static void Main(string[] args) {
        string string = "Hello, world! 123";
        Console.WriteLine(RemoveNonAlphabeticCharacters(string));
        // Output: "Hello world"
    }
}

R：

remove_non_alphabetic_characters <- function(string) {
  gsub("[^a-zA-Z]", "", string)
}

remove_non_alphabetic_characters("Hello, world! 123")
# Output: "Hello world"

Rust：

use regex::Regex;

fn remove_non_alphabetic_characters(string: &str) -> String {
    Regex::new(r"[^a-zA-Z]").unwrap().replace_all(string, "").to_string()
}

fn main() {
    let string = "Hello, world! 123";
    println!("{}", remove_non_alphabetic_characters(string));
    // Output: "Hello world"
}

Swift：

import Foundation

func removeNonAlphabeticCharacters(string: String) -> String {
    let regex = try! NSRegularExpression(pattern: "[^a-zA-Z]")
    return regex.stringByReplacingMatches(in: string, range: NSRange(location: 0, length: string.utf16.count), withTemplate: "")
}

print(removeNonAlphabeticCharacters(string: "Hello, world! 123"))
// Output: "Hello world"

Kotlin：

fun removeNonAlphabeticCharacters(string: String): String {
    return string.replace(Regex("[^a-zA-Z]"), "")
}

println(removeNonAlphabeticCharacters("Hello, world! 123"))
// Output: "Hello world"

Go：

import (
    "regexp"
)

func removeNonAlphabeticCharacters(string string) string {
    reg := regexp.MustCompile("[^a-zA-Z]")
    return reg.ReplaceAllString(string, "")
}

func main() {
    string := "Hello, world! 123"
    fmt.Println(removeNonAlphabeticCharacters(string))
    // Output: "Hello world"
}