目的,匹配html中的标签种类
例如,html中有很多 <a>标签,但他们是一种标签
代码
<a href=> </a> </a>
<b> </b>
<a href=> </a> </a> 求匹配出两组匹配,分别是 <a>, <b>,而不是三个, <a>, <b>, <a> 也就是匹配结果去除重复
例如,html中有很多 <a>标签,但他们是一种标签
代码
<a href=> </a> </a>
<b> </b>
<a href=> </a> </a> 求匹配出两组匹配,分别是 <a>, <b>,而不是三个, <a>, <b>, <a> 也就是匹配结果去除重复
即使有也要匹配多次,
还不如简单的匹配一次再去掉重复.
<[^\s/>]+(?=\s|>)
这里有个清楚标签的方法你看看(通过正则来找到,然后删除):
http://www.cnblogs.com/lifenostink/archive/2008/01/03/1024176.html