正则表达式那些让人头晕的元字符

 更新时间:2021-08-04 16:02:31   作者:佚名   我要评论(0)

目录0.写在前面1.特殊单字符2.空白符3.范围4.量词5.实战1.如何表达一个两位数字的范围2.如何表达一个三位数字的范围3.组合6.写在最后0.写在前

0.写在前面

在开发中,正则表达式常用于邮箱、手机号的校验,文本的批量查找、替换等操作。

大部分同学,在拿到需求的时候,第一件事一定是打开浏览器,搜索:邮箱 正则表达式 怎么写,然后Ctrl C + V,测试几个条件没问题,就提交了,出了问题也不知道怎么修改,只能再求救热心网友。

本篇文章,主要带大家了解一下,正则表达式的基本用法,有个初步的了解,看到正则后不再一脸懵。

比如IPv4地址的正则表达式:

复制代码 代码如下:

^([1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5])(\.(0|[1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5])){3}$

如果你没看过本篇文章,第一眼看到这个表达式一定有点头晕,乱七八糟写的是啥,别担心,学完后你就会发现,那些看似复杂的表达式,其实也不过如此。

本篇文章主要内容的思维导图,后续可用于快速查询:

思维导图

1.特殊单字符

在正则表达式中,普通字符表示的还是原来的意思,比如表达式 1 可以匹配到数字 1,表达式 a 可以匹配到字母 a

但是如果想要匹配到更多字符的时候,我们不可能把所有的字符都列一遍,这样就太浪费时间了,那有什么更好的办法呢,接下来就是元字符大显身手的时间了。

. 点号通配符,可以匹配到除换行外的任意字符:

点号通配符

\d 数字通配符,可以匹配到数字0-9

\D 如果将D大写,则匹配到的是任意非数字,相当于 \d 的反义

数字通配符

\w 字母数字下划线通配符,可以匹配到任意的字母数字下划线

\W 如果将W大写,则匹配到的是任意非字母数字下划线

字母数字下划线通配符

\s 空白符通配符,可以配到任意空白符,包括回车、换行、换页、制表符等

\S 如果将S大写,则匹配到的是任意非空白符

空白符通配符

到这里,特殊单字符就讲完了,汇总下:

特殊单字符

2.空白符

空白符分为下图中的几类,一般我们用 \s 表示就可以了:

空白符

3.范围

| 或,和你心中想的那个或是一样的,ab|bc 可以匹配到ab或者bc

[...] 多选一,比如 [abc] 可以匹配到字母a,也可以匹配到字母b或c

[a-z] 匹配a到z之间的任意元素,\w 这个通配符就可以用 【a-zA-Z0-9_】 来表示

[^...] 取反,不能是括号内的任意单个元素

注意:以上的表达式每次只能匹配到单个元素

范围

4.量词

* 星号,代表出现0到多次,可以出现,也可以不出现,出现的话,不限制次数

+ 加号,代表出现1到多次,也就是至少出现一次的意思

? 问号,代表出现0到1次,比如Http协议的正则就可以用 Https? 表示

{m} 代表出现m次,比如 a{1} 就表示匹配的规则中,字母a只能出现1次

{m,} 代表至少出现m次,{0,} 相当于星号,{1,} 相当于加号

{m,n} 代表出现m到n次,{0,1} 相当于问号

量词

5.实战

现在我们再回过头来,看下文章开头的正则表达式:

复制代码 代码如下:

^([1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5])(\.(0|[1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5])){3}$

是不是觉得有点思路了,下面我们一起来实现下,先讲讲规则:

  • IPv4地址的范围,我们定义为 1.0.0.0 - 255.255.255.255,当然专业上肯定有更严格的定义划分,我们此处不纠结
  • 通过以上范围,我们可以得出基本规则 [1-255].[0-255].[0-255].[0-255]
  • 可以看出后三位是重复的 .[0-255],所以我们只需要先写出 [0-255] 的规则,后面就很简单了
  • ^$ 用于标识行的开始和结束,这个我们下一篇文章会讲到

开始吧:

1.如何表达一个两位数字的范围

通过上面的学习,我们知道一个数字可以用 \d[0-9] 来表示,如果要表达多位数呢,比如0-99。

可以这样拆分,0-99的范围,最少的位数是1位,最多的位数是2位,那我们可以用2个数字通配符来表示,为了清晰和美观,我们此处用 **[0-9]**表示。

写起来就是:

复制代码 代码如下:

0|[1-9][0-9]?

其中,0 代表数字0,因为要排除 00 的情况,所以不能使用 [0-9][0-9]? 来表示,中间有个或 |,后面的 [1-9][0-9]? 表示1-99,还记得 ? 的含义吗,代表出现0到1次。

2.如何表达一个三位数字的范围

两位的写完了,三位的就很简单了,我们来写下0-255的范围。

这里要注意下:

  • 当数字达到3位的时候,百位只能是1或2
  • 当百位数字是2的时候,十位数字只能是0-5
  • 当十位数字是5的时候,个位数字只能是0-5

来写一下:

复制代码 代码如下:

0|[1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5]

0-255到范围写完了,去掉0就成了1-255的范围:

复制代码 代码如下:

[1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5]

3.组合

最后组合下,还记得 {3} 的含义吗,代表这个字符或组合出现3次:

注意:. 点号别忘了用 \ 转义下

复制代码 代码如下:

^([1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5])(\.(0|[1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5])){3}$

大功告成,有没有豁然开朗的感觉,验证下:

IPv4

6.写在最后

到这里,正则表达式的基本用法就讲完了,如果有问题可以给我留言评论,谢谢。

正则表达式在线校验工具:https://regex101.com/

到此这篇关于正则表达式那些让人头晕的元字符的文章就介绍到这了,更多相关正则表达式 元字符内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
  • Python正则表达式和元字符详解
  • 详解正则表达式 \v 元字符
  • 浅析正则表达式 元字符和普通字符
  • 详解Sed命令的用法与正则表达式元字符
  • 正则表达式教程之元字符的使用详解
  • 正则表达式\d元字符(相对于数字0-9)
  • 正则表达式\W元字符使用方法
  • 正则表达式\w元字符使用介绍
  • 正则表达式常用元字符整理小结

相关文章

  • 正则表达式那些让人头晕的元字符

    正则表达式那些让人头晕的元字符

    目录0.写在前面1.特殊单字符2.空白符3.范围4.量词5.实战1.如何表达一个两位数字的范围2.如何表达一个三位数字的范围3.组合6.写在最后0.写在前
    2021-08-04
  • 正则表达式量词与贪婪的使用详解

    正则表达式量词与贪婪的使用详解

    目录0.写在前面1.量词2.贪婪模式前传2.1 使用 a+ 进行匹配2.2 使用 a* 进行匹配3.贪婪模式4.非贪婪模式5.独占模式5.1 贪婪匹配过程5.2 非贪婪
    2021-08-04
  • 正则表达式分组与引用的使用

    正则表达式分组与引用的使用

    目录0.写在前面1.分组与编号2.不保存子组3.分组引用4.查找与替换 查找替换5.在文本编辑器中使用查找替换6.写在最后0.写在前面 今天我们来讲下
    2021-08-04
  • 正则表达式常见的4种匹配模式小结

    正则表达式常见的4种匹配模式小结

    目录0.写在前面1.不区分大小写模式2.点号通配模式3.多行匹配模式4.注释模式5.写在最后0.写在前面 今天一起来学习下正则中的匹配模式,所谓的
    2021-08-04
  • shell脚本中的正则表达式详解

    shell脚本中的正则表达式详解

    正则表达式的概念及特点:   正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个
    2021-08-04
  • Java正则表达式里隐藏的陷阱

    Java正则表达式里隐藏的陷阱

    前几天线上一个项目监控信息突然报告异常,上到机器上后查看相关资源的使用情况,发现 CPU 利用率将近 100%。通过 Java 自带的线程 Dump 工具
    2021-08-04
  • Java正则表达式实现经纬度的合法性操作

    Java正则表达式实现经纬度的合法性操作

    Java正则表达式 经纬度合法性 经度: -180.0~+180.0(整数部分为0~180,必须输入1到5位小数) 正则表达式: /^[\-\+]?(0?\d{1,2}
    2021-08-04
  • Idea使用正则表达式批量替换字符串的方法

    Idea使用正则表达式批量替换字符串的方法

    由于一开始的粗放扩张,公司项目代码里,遗留有很多类似魔法数的写死的id,导致现在维护困难。于是交给我任务,将这些id替换成静态变量。 这
    2021-08-04
  • .net core异常中间件的使用

    .net core异常中间件的使用

    目录正文结 正文 if (env.IsDevelopment()) { app.UseDeveloperExceptionPage(); } 这样写入中间件哈,那么在env环境下就会去执行UseDe
    2021-08-04
  • ASP.NET Core文件压缩常见使用误区(最佳实践)

    ASP.NET Core文件压缩常见使用误区(最佳实践)

    前言   在微软官方文档中,未明确指出文件压缩功能的使用误区。   本文将对 ASP.NET Core 文件响应压缩的常见使用误区做出说明。 误区1:
    2021-08-04

最新评论