(.+?) 这个模式怎么解释呀?. 表示任何非换行字符
+ 表示一个或多个前面的字符
?表示0个或1个前面的字符那么合起来表示什么意思呢?
+ 表示一个或多个前面的字符
?表示0个或1个前面的字符那么合起来表示什么意思呢?
解决方案 »
- C# 返回数据库中的值问题
- 关于 Owner和ParentForm属性
- 怎么做驱动程序备份和恢复的程序?
- 如何把图片放进程序里面当成一个对象来使用
- 在winform里,怎样点击一个按钮,弹出一个指定的网页来?
- 解释一下“类型参数化”
- 在vs2005中,制作安装程序,怎么知道用户选的安装路径从而写入注册表?我是想做开机启动
- 一个看似简单的问题(对象调用类的私有成员)
- 发送邮件时为何会出现“邮件无法发送到 SMTP 服务器。传输错误代码为 0x800ccc15。服务器响应为 not available ”
- 关于C#,菜鸟求助
- C# 调用wmi获取磁盘逻辑分区名字
- WebService的构造函数能不能接收用户传递的参数
2.1 匹配次数中的贪婪与非贪婪
在使用修饰匹配次数的特殊符号时,有几种表示方法可以使同一个表达式能够匹配不同的次数,比如:"{m,n}", "{m,}", "?", "*", "+",具体匹配的次数随被匹配的字符串而定。这种重复匹配不定次数的表达式在匹配过程中,总是尽可能多的匹配。比如,针对文本 "dxxxdxxxd",举例如下:表达式
匹配结果
(d)(\w+)
"\w+" 将匹配第一个 "d" 之后的所有字符 "xxxdxxxd"
(d)(\w+)(d)
"\w+" 将匹配第一个 "d" 和最后一个 "d" 之间的所有字符 "xxxdxxx"。虽然 "\w+" 也能够匹配上最后一个 "d",但是为了使整个表达式匹配成功,"\w+" 可以 "让出" 它本来能够匹配的最后一个 "d"
由此可见,"\w+" 在匹配的时候,总是尽可能多的匹配符合它规则的字符。虽然第二个举例中,它没有匹配最后一个 "d",但那也是为了让整个表达式能够匹配成功。同理,带 "*" 和 "{m,n}" 的表达式都是尽可能地多匹配,带 "?" 的表达式在可匹配可不匹配的时候,也是尽可能的 "要匹配"。这 种匹配原则就叫作 "贪婪" 模式 。 非贪婪模式: 在修饰匹配次数的特殊符号后再加上一个 "?" 号,则可以使匹配次数不定的表达式尽可能少的匹配,使可匹配可不匹配的表达式,尽可能的 "不匹配"。这种匹配原则叫作 "非贪婪" 模式,也叫作 "勉强" 模式。如果少匹配就会导致整个表达式匹配失败的时候,与贪婪模式类似,非贪婪模式会最小限度的再匹配一些,以使整个表达式匹配成功。举例如下,针对文本 "dxxxdxxxd" 举例:表达式
匹配结果
(d)(\w+?)
"\w+?" 将尽可能少的匹配第一个 "d" 之后的字符,结果是:"\w+?" 只匹配了一个 "x"
(d)(\w+?)(d)
为了让整个表达式匹配成功,"\w+?" 不得不匹配 "xxx" 才可以让后边的 "d" 匹配,从而使整个表达式匹配成功。因此,结果是:"\w+?" 匹配 "xxx"
更多的情况,举例如下: 举例1:表达式 "<td>(.*)</td>" 与字符串 "<td><p>aa</p></td> <td><p>bb</p></td>" 匹配时,匹配的结果是:成功;匹配到的内容是 "<td><p>aa</p></td> <td><p>bb</p></td>" 整个字符串, 表达式中的 "</td>" 将与字符串中最后一个 "</td>" 匹配。 举例2:相比之下,表达式 "<td>(.*?)</td>" 匹配举例1中同样的字符串时,将只得到 "<td><p>aa</p></td>", 再次匹配下一个时,可以得到第二个 "<td><p>bb</p></td>"。好好的看看这个链接,能学到很多东西,有时想不通要多看些例子就慢慢理解了
+表示贪婪模式匹配,尽可能多的匹配符合前面规则的字符
+?合起来是一个关键符号表示非贪婪模式匹配,至少有1个,如果找到了,并符合后面的表达式,则停止
*?也是非贪婪表达式,表示0个或多个,但尽可能少的匹配
非贪婪模式的尽可能少的意思是在能最大情况满足表达式,让后面部分能实现的前提下。
()表示分组比如
.+?123 ->能匹配abcd123def1234567890中第一次出现的的abcd123
.+123 ->则匹配abcd123def1234567890中的abcd123def123
可以下载我的正则工具来测试学习
RegexCompare 4.0