初学正则表达式
本来是想写过滤html标记的表达式
如下
(?<tag>\w(\w|\d)*)
(?<attr>\w(\w|\d)*(\s)*=(\s)*(?<quo>("|')?)[^"']*\k<quo>)
完整的表达式是
<(?<tag>\w(\w|\d)*)((\s)+(?<attr>\w(\w|\d)*(\s)*=(\s)*(?<quo>("|')?)[^"']*\k<quo>))*(\s)*>((?<content>.*?)</\k<tag>>)?但是这个表达式可以找到很近的匹配,远了以后却找不到,如<html> 却找不到</html>
近一点的<script>,<table>之类的却可以找到
不清楚为什么
谢谢