正则入门:惰性匹配

.*?
服务器君一共花费了337.875 ms进行了6次数据库查询,努力地为您提供了这个页面。
试试阅读模式?希望听取您的建议

惰性匹配(lazy)

它会匹配尽可能少的字符,它从第一个字符开始找起,一旦符合条件,立刻保存到匹配集合中,然后继续进行查找。所以说它是懒惰的。

还是这个例子:

nowamagic.net is a <b>good</b> website to <b>learn</b> IT <b>skills</c>.

<b>.*</b> 

效果演示

nowamagic.net is a good website to learn IT skills.

本例代码

function reg_replace()
{
	var test = document.getElementById("test");
	aim = "<b>.*</b> ";
	var regex = new RegExp("("+aim+")","g");
	test.innerHTML = test.innerHTML.replace(regex,"<span style='background-color:orange'>$1</span>");
}

这样匹配显然不是我们的初衷,它仅找到了一个匹配,而通常情况下,我们希望得到的是<b>good</b> 和 <b>learn</b> 两个匹配。

解决的办法,就是上面说到的惰性匹配,它的语法如下表所示:

贪婪匹配 惰性匹配 匹配描述
? ?? 匹配 0 个或 1 个
+ +? 匹配 1 个或多个
* *? 匹配 0 个或多个
{n} {n}? 匹配 n 个
{n,m} {n,m}? 匹配 n 个或 m 个
{n,} {n,}? 匹配 n 个或多个

对于本例,当我们再使用惰性匹配。

<b>.*?</b> 

效果演示

nowamagic.net is a good website to learn IT skills.

惰性匹配的匹配过程

n	// 不匹配,继续
no	// 不匹配,继续
...  // 中间略
nowamagic.net is a <	// 找到可能匹配的字符,继续
nowamagic.net is a <b	// 找到可能匹配的字符,继续
...  // 中间略
//找到匹配,保存到结果集中,继续进行剩下的文本。
nowamagic.net is a <b>good</b> website to <b>learn</b> IT <b>skills</c>. 
w	// 不匹配,继续
we	// 不匹配,继续
website to <		// 找到可能的匹配,继续	
website to <b	// 找到可能的匹配,继续
...  // 中间略
//找到匹配,保存到结果集中,继续进行剩下的文本。
website to <b>learn</b>
I	//不匹配,继续
IT	//不匹配,继续
IT <	// 找到可能的匹配,继续
IT <b	// 找到可能的匹配,继续
...  // 中间略
IT <b>skills</c>. 	// 匹配失败,继续找
IT <b>skills</c>. 	// 不匹配,继续
// 字符串结束,匹配结束。一共找到了两个匹配<b>good</b>和<b>learn</b>
IT <b>skills</c>. 

我们回顾一下上面 “\d{1,3}” 匹配数字的例子,对于“1234”,当我们使用“\d{1,3}”时,进行的是贪婪匹配,它首先找到“123”(因为“1234”不符合),之后的“4”也符合,所以,找到的匹配是“123”和“4”。

当我们使用“\d{1,3}?”匹配上面的例子,对于“1234”,这次是惰性匹配。首先,发现“1”符合,将“1”保存到匹配集合中;随后,依次发现“2”、“3”、“4”符合,并依次保存到结果集中,最后,我们得到了四个匹配“1”、“2”、“3”、“4”。

延伸阅读

此文章所在专题列表如下:

  1. 什么是正则表达式?
  2. 正则入门:匹配固定的单个字符
  3. 正则入门:匹配任意的单个字符
  4. 正则入门:字符组的使用
  5. 正则入门:在字符组中使用字符区间
  6. 正则入门:反义字符组的使用
  7. 正则入门:匹配空字符
  8. 正则入门:匹配一个或多个字符
  9. 正则入门:匹配零个或多个字符
  10. 正则入门:匹配零个或一个字符串
  11. 正则入门:匹配固定数目的字符
  12. 正则入门:匹配区间内数目的字符
  13. 正则入门:贪婪匹配
  14. 正则入门:惰性匹配
  15. 正则入门:两个匹配模式
  16. 正则入门:匹配单词边界
  17. 正则入门:边界的定义与相对性
  18. 正则入门:匹配非单词边界
  19. 正则入门:匹配文本首和尾
  20. 正则入门:子模式
  21. 正则入门:“或”匹配
  22. 正则入门:后向引用文本替换
  23. 正则入门:非获取匹配
  24. 正则总结:JavaScript中的正则表达式
  25. 正则总结:正则表达式在js中的高级应用

本文地址:http://www.nowamagic.net/librarys/veda/detail/1038,欢迎访问原出处。

不打个分吗?

转载随意,但请带上本文地址:

http://www.nowamagic.net/librarys/veda/detail/1038

如果你认为这篇文章值得更多人阅读,欢迎使用下面的分享功能。
小提示:您可以按快捷键 Ctrl + D,或点此 加入收藏

大家都在看

阅读一百本计算机著作吧,少年

很多人觉得自己技术进步很慢,学习效率低,我觉得一个重要原因是看的书少了。多少是多呢?起码得看3、4、5、6米吧。给个具体的数量,那就100本书吧。很多人知识结构不好而且不系统,因为在特定领域有一个足够量的知识量+足够良好的知识结构,系统化以后就足以应对大量未曾遇到过的问题。

奉劝自学者:构建特定领域的知识结构体系的路径中再也没有比学习该专业的专业课程更好的了。如果我的知识结构体系足以囊括面试官的大部分甚至吞并他的知识结构体系的话,读到他言语中的一个词我们就已经知道他要表达什么,我们可以让他坐“上位”毕竟他是面试官,但是在知识结构体系以及心理上我们就居高临下。

所以,阅读一百本计算机著作吧,少年!

《Python学习手册(第4版)》 鲁特兹(Mark Lutz) (作者), 李军 (译者), 刘红伟 (译者), 等 (译者)

《Python学习手册(第4版)》学习Python的主要内建对象类型:数字、列表和字典。使用Python语句创建和处理对象,并且学习Python的通用语法模型。使用函数构造和重用代码,函数是Python的基本过程工具。学习Python模块:封装语句、函数以及其他工具,以便构建较大的组件。学习Python的面向对象编程工具,用于组织程序代码。学习异常处理模型,以及用于编写较大程序的开发工具。了解高级Python工具,如装饰器、描述器、元类和Unicode处理等。

更多计算机宝库...