大学IT网 - 最懂大学生的IT学习网站! QQ资料交流群:367606806
当前位置:大学IT网 > Java技巧 > Java正则表达式中的Possessive数量修饰词的理解

Java正则表达式中的Possessive数量修饰词的理解

关键词:JavaJava正则表达式中的Possessive数量修饰  阅读(600) 赞(17)

[摘要]本文主要是对Java正则表达式中的Possessive数量修饰词的理解的讲解,希望对大家学习Java正则表达式中的Possessive数量修饰词的理解有所帮助。

  正则表达式对于数量限定符如 ?, + , *, {n, m} 的匹配默认是贪婪模式,比如:

  a.*b 匹配 acbab 的结果是 acbab 而不是acb

  正则表达式支持懒惰模式,也就是在数量限定符后加一个数量修饰词(quantifier),用问号表示, 比如:

  a.*?b 匹配 acbab 的结果是 acb 而不是acbab

  而Java语言在正则表达式中支持一种Possessive 数量修饰词 ,用加号表示。其字面意思是像贪婪模式一样匹配,但不回溯。这到底是什么意思呢?其实这和匹配算法相关,比如:

  在贪婪模式下,正则表达式 a.*b 在匹配 acbac时,在匹配成功第一个字符a后,匹配算法会继续往后读取字符a之后的字符来匹配.* , 这时贪婪模式就起作用了,a后面的cbac都能匹配.*,但当匹配算法继续往后读取字符时,发现已经没有字符可读了,无法匹配正则表达式中的b了,于是就回溯一个字符,看c是否能匹配b,不能,继续回溯,直到回溯到b时,才匹配到了acb。 而a.*+b在匹配时是不会回溯的,也就是说当贪婪地读到最后一个字符时发现无有字符与b匹配了,就认为匹配失败了。

  再举几个例子

  (ab)*+a 匹配 ababacd 时 可以匹配到 ababa , 因为两个ab之后没有ab了,无法贪婪

  a?+a 匹配aaaaa 时会匹配到 aa ,但 a++a和a{0, 10}+a却会匹配失败



相关评论