正则表达式进阶指南：掌握正则表达式的高级用法

前端

2023-12-08 06:10:55

掌握正则表达式的进阶技巧，解锁文本处理的强大潜力

前置断言：精确匹配，剔除无关

正则表达式中，前置断言如同一双透视眼，能探测到紧邻目标字符或子串的存在。

正向前置断言 ?=：只有在目标元素后面紧跟着指定字符或子串时，才匹配。
负向前置断言 ?!：只有在目标元素后面不紧跟着指定字符或子串时，才匹配。

想象一下，您想找到包含 "abc" 子串的所有句子。正向前置断言可以让您匹配以 "a" 开头、后面紧跟 "bc" 的句子，而负向前置断言则可以排除掉以 "abc" 开头的句子，为您提供更精准的结果。

后置断言：回顾过往，避免误判

后置断言与前置断言类似，但它们关注的是目标元素前面紧邻的字符或子串。

正向后置断言 ?<=：只有在目标元素前面紧跟着指定字符或子串时，才匹配。
负向后置断言 ?<!：只有在目标元素前面不紧跟着指定字符或子串时，才匹配。

比如，您想匹配以 "a" 结尾并前面紧跟 "bc" 的句子。这时，正向后置断言就可以派上用场了。而负向后置断言则可以帮助您排除掉以 "a" 结尾但前面没有 "bc" 的句子，让匹配结果更加准确。

捕获性括号：存储匹配，灵活利用

捕获性括号就如同一张张网，可以将匹配到的字符或子串牢牢捕捉住，并存储在变量中。这些被捕获的子表达式可以通过变量 $1、$2、$3 等进行访问。

举个例子，如果您想提取一个字符串中所有以 "http" 开头的 URL，可以使用捕获性括号将 URL 匹配并存储在变量中。这样，您就可以轻松地对这些 URL 进行进一步处理，例如解析出域名或路径。

非捕获性括号：轻装上阵，高效处理

非捕获性括号与捕获性括号功能相似，但它们不会将匹配到的内容存储在变量中。这对于处理大量数据时非常有用，因为非捕获性括号可以减少正则表达式引擎的工作量，提高匹配效率。

例如，如果您只想检查一个字符串中是否包含 "abc" 子串，可以使用非捕获性括号进行匹配。这样，正则表达式引擎无需将匹配到的子串存储在变量中，从而可以更快地完成匹配过程。

贪婪与非贪婪模式：掌控匹配范围

正则表达式默认采用贪婪模式，即尽可能匹配更多的字符。但有时，您可能需要限制匹配范围，此时就需要用到非贪婪模式。

贪婪模式：使用量词（如 +、*）后不加 ?，匹配尽可能多的字符。
非贪婪模式：使用量词后加 ?，匹配尽可能少的字符。

假设您想匹配一个字符串中连续出现的 "a"，但又不想匹配到整个字符串中的所有 "a"。此时，非贪婪模式就可以派上用场了。它可以限制匹配范围，仅匹配到连续出现的第一个 "a"。

示例代码：实战应用

为了更好地理解正则表达式的进阶用法，这里提供一些示例代码：

// 匹配以 "a" 开头且以 "b" 结尾的字符串
const regex1 = /^a.*b$/;

// 匹配包含 "abc" 子串的字符串
const regex2 = /.*abc.*/;

// 匹配以 "a" 开头且紧跟 "b" 的字符串
const regex3 = /^a(?=b)/;

// 匹配以 "a" 开头但不紧跟 "b" 的字符串
const regex4 = /^a(?!b)/;

// 匹配紧跟 "a" 后面的 "b"
const regex5 = /a(?<=a)b/;

// 匹配不紧跟 "a" 后面的 "b"
const regex6 = /a(?!a)b/;

// 捕获以 "a" 开头且以 "b" 结尾的字符串
const regex7 = /(a.*)b/;

// 匹配 "abc" 子串，但不将其捕获
const regex8 = /(?:abc)/;

// 匹配 "a" 或 "b"
const regex9 = /a|b/;

// 匹配 "a" 或 "b"，并捕获匹配结果
const regex10 = /(a|b)/;

// 匹配 "a" 或 "b"，并捕获匹配结果，但不将其存储在变量中
const regex11 = /(?:a|b)/;

// 匹配一个或多个 "a"
const regex12 = /a+/;

// 匹配零个或多个 "a"
const regex13 = /a*/;

// 匹配一个或多个 "a"，并捕获匹配结果
const regex14 = /(a+)/;

// 匹配零个或多个 "a"，并捕获匹配结果
const regex15 = /(a*)/;

// 匹配 "a" 出现 3 次
const regex16 = /a{3}/;

// 匹配 "a" 出现 3 次或更多
const regex17 = /a{3,}/;

// 匹配 "a" 出现 3 次或更少
const regex18 = /a{0,3}/;