正则表达式中的分组与引用，学起来不再头痛！

前端

2023-11-22 04:23:26

分组

分组是将正则表达式中的某个子表达式用圆括号括起来。分组后的子表达式可以被引用，也可以被重复使用。

引用

引用是指在正则表达式中使用反斜杠和数字来引用分组。反斜杠后的数字表示分组的编号。例如，\1表示引用第一个分组，\2表示引用第二个分组，以此类推。

分组和引用的作用

分组和引用可以用于以下几种情况：

提取匹配的子字符串 ：可以使用分组来提取匹配的子字符串。例如，下面的正则表达式可以匹配一个电子邮箱地址，并且提取出用户名和域名：

^([a-zA-Z0-9_.+-]+)@([a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+)$

这个正则表达式中有两个分组：第一个分组匹配用户名，第二个分组匹配域名。我们可以使用Python的re模块来提取匹配的子字符串：

import re

pattern = r'^([a-zA-Z0-9_.+-]+)@([a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+)import re

pattern = r'^([a-zA-Z0-9_.+-]+)@([a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+)$'
string = 'username@example.com'

match = re.search(pattern, string)
if match:
    username, domain = match.groups()
    print(username)  # 输出：username
    print(domain)  # 输出：example.com
#x27;
string = 'username@example.com'

match = re.search(pattern, string)
if match:
    username, domain = match.groups()
    print(username)  # 输出：username
    print(domain)  # 输出：example.com

重复使用分组 ：可以使用引用来重复使用分组。例如，下面的正则表达式可以匹配一个电话号码，并且提取出区号、电话号码和分机号：

^(\d{3})-(\d{3})-(\d{4})(\s*x(\d+))?$

这个正则表达式中有三个分组：第一个分组匹配区号，第二个分组匹配电话号码，第三个分组匹配分机号。我们可以使用引用来重复使用第一个分组和第二个分组，从而匹配一个带区号的电话号码：

^(\d{3})-(\d{3})-(\d{4})$

创建更复杂的正则表达式 ：分组和引用可以用于创建更复杂的正则表达式。例如，下面的正则表达式可以匹配一个HTML标签中的所有属性：

<[^>]+>

这个正则表达式中有两个分组：第一个分组匹配标签名，第二个分组匹配标签中的所有属性。我们可以使用引用来提取标签名和标签中的所有属性：

import re

pattern = r'<([^>]+)>(.*)</\1>'
string = '<p id="content">Hello, world!</p>'

match = re.search(pattern, string)
if match:
    tag_name, attributes = match.groups()
    print(tag_name)  # 输出：p
    print(attributes)  # 输出：id="content"

结语

分组和引用是正则表达式中的两个非常重要的概念。掌握了这两个概念，可以极大地提高正则表达式的使用效率。

Kyle

探索Web开发资源和人工智能教程的代码社区

联系我

扫码关注微信公众号

正则表达式中的分组与引用，学起来不再头痛！

Kyle

优化网页载入速度必备技能——lazyLoad和v-lazy详细解析

JavaScript 面向对象学习与应用全解析

Element-UI 进阶——表格组件封装提升使用体验

原型链前端知识梳理

在 Node.js 中实现 “相对可靠” 的高效执行可信三方的代码