正则入门:贪婪匹配

匹配尽可能多的字符
服务器君一共花费了345.501 ms进行了7次数据库查询,努力地为您提供了这个页面。
试试阅读模式?希望听取您的建议

贪婪匹配(greedy)

它会匹配尽可能多的字符。它首先看整个字符串,如果不匹配,对字符串进行收缩;遇到可能匹配的文本,停止收缩,对文本进行扩展,当发现匹配的文本时,它不着急将该匹配保存到匹配集合中,而是对文本继续扩展,直到无法继续匹配 或者 扩展完整个字符串,然后将前面最后一个符合匹配的文本(也是最长的)保存起来到匹配集合中。所以说它是贪婪的。

光看上面的定义,我们很难有一个生动的认识,现在假设我们要匹配下面 <b>和</b> 之间的文本。为了做演示,尽管不符合 HTML 的定义,我们再加入一段<b>和</c>之间的文本:

nowamagic.net is a <b>good</b> website to <b>learn</b> IT <b>skills</c>.

<b>.*</b> 

效果演示

nowamagic.net is a good website to learn IT skills.

本例代码

function reg_replace()
{
	var test = document.getElementById("test");
	aim = "<b>.*</b> ";
	var regex = new RegExp("("+aim+")","g");
	test.innerHTML = test.innerHTML.replace(regex,"<span style='background-color:orange'>$1</span>");
}

这样匹配显然不是我们的初衷,它仅找到了一个匹配,而通常情况下,我们希望得到的是<b>junior</b> 和 <b>living</b> 两个匹配。

贪婪匹配的匹配过程

//不匹配,收缩
nowamagic.net is a <b>good</b> website to <b>learn</b> IT <b>skills</c>. 
//不匹配,收缩
owamagic.net is a <b>good</b> website to <b>learn</b> IT <b>skills</c>. 
//不匹配,收缩
wamagic.net is a <b>good</b> website to <b>learn</b> IT <b>skills</c>. 
...   //中间略
// 找到可能匹配的,扩展
<b>good</b> website to <b>learn</b> IT <b>skills</c>. 
// 找到可能匹配的,扩展
<b>good</b> website to <b>learn</b> IT <b>skills</c>. 
// 找到可能匹配的,扩展
<b>good</b> website to <b>learn</b> IT <b>skills</c>. 
...   //中间略
 //找到一个匹配,但是并不保存到结果集中,而是继续进行扩展
<b>good</b> website to <b>learn</b> IT <b>skills</c>. 
<b>good</b> website to <b>learn</b> IT <b>skills</c>. 
// 找到可能匹配的,扩展
<b>good</b> website to <b>learn</b> IT <b>skills</c>. 
//字符串结束,将前面找到的最后一个匹配 <b>good</b> website to <b>learn</b> 保存到匹配结果集中
<b>good</b> website to <b>learn</b> IT <b>skills</c>. 

延伸阅读

此文章所在专题列表如下:

  1. 什么是正则表达式?
  2. 正则入门:匹配固定的单个字符
  3. 正则入门:匹配任意的单个字符
  4. 正则入门:字符组的使用
  5. 正则入门:在字符组中使用字符区间
  6. 正则入门:反义字符组的使用
  7. 正则入门:匹配空字符
  8. 正则入门:匹配一个或多个字符
  9. 正则入门:匹配零个或多个字符
  10. 正则入门:匹配零个或一个字符串
  11. 正则入门:匹配固定数目的字符
  12. 正则入门:匹配区间内数目的字符
  13. 正则入门:贪婪匹配
  14. 正则入门:惰性匹配
  15. 正则入门:两个匹配模式
  16. 正则入门:匹配单词边界
  17. 正则入门:边界的定义与相对性
  18. 正则入门:匹配非单词边界
  19. 正则入门:匹配文本首和尾
  20. 正则入门:子模式
  21. 正则入门:“或”匹配
  22. 正则入门:后向引用文本替换
  23. 正则入门:非获取匹配
  24. 正则总结:JavaScript中的正则表达式
  25. 正则总结:正则表达式在js中的高级应用

本文地址:http://www.nowamagic.net/librarys/veda/detail/1037,欢迎访问原出处。

不打个分吗?

转载随意,但请带上本文地址:

http://www.nowamagic.net/librarys/veda/detail/1037

如果你认为这篇文章值得更多人阅读,欢迎使用下面的分享功能。
小提示:您可以按快捷键 Ctrl + D,或点此 加入收藏

大家都在看

阅读一百本计算机著作吧,少年

很多人觉得自己技术进步很慢,学习效率低,我觉得一个重要原因是看的书少了。多少是多呢?起码得看3、4、5、6米吧。给个具体的数量,那就100本书吧。很多人知识结构不好而且不系统,因为在特定领域有一个足够量的知识量+足够良好的知识结构,系统化以后就足以应对大量未曾遇到过的问题。

奉劝自学者:构建特定领域的知识结构体系的路径中再也没有比学习该专业的专业课程更好的了。如果我的知识结构体系足以囊括面试官的大部分甚至吞并他的知识结构体系的话,读到他言语中的一个词我们就已经知道他要表达什么,我们可以让他坐“上位”毕竟他是面试官,但是在知识结构体系以及心理上我们就居高临下。

所以,阅读一百本计算机著作吧,少年!

《深入理解MySQL核心技术》 Sasba Pacbev (作者), 李芳 (译者), 于红芸 (译者), 邵健 (译者)

《深入理解MySQL核心技术》:从公共可用性的意义上讲,MySQL源代码是开放源代码,但如果对其不了解,则实质上,它对于您来说是封闭的。MysQL开发团队的前成员Sasha Pachev通过《深入理解MySQL核心技术》给出了MySQL 5的全面指南,揭示了这一强大数据库的内部运作。您将直奔MySQL核心技术,了解各种数据结构和各种方便的功能的运作情况,了解如何添加新的存储引擎和配置选项等。 《深入理解MySQL核心技术》从结构概况讲起,在这一部分解释了MysQL的不同组件是如何协同工作的。接着将学习设置有效的可编译代码副本的步骤,然后使用基本架构添加自己的配置变量和存储引擎。

更多计算机宝库...