我在做文章系统的时候要过滤掉一些字符.
比如 共产党 什么的.只是 共产党 倒好办,但如果是
<font>共</font>产党
或者
<a href="">共<strong>产</strong>党</a>我应该怎么过滤呢?
比如 共产党 什么的.只是 共产党 倒好办,但如果是
<font>共</font>产党
或者
<a href="">共<strong>产</strong>党</a>我应该怎么过滤呢?
调试欢乐多
string outpu=Regex.Replace(inputtext,"共(?<A>.*?)産(?<B>.*?)党","${A}${B}");
Console.WriteLine(outpu);
---------------------------------------------------------
输出 2312,69***************** rtb</d>
而且还要是惰性的.
中间出现哪些字符是不被过滤, 哪些对会被过滤?中间出现可显示的字符就不用过滤它?共(\s*((?(o)\<).*(?(-o)\>)\s*[^\w]+\s*)*\s*)*产党
中间出现哪些字符是不被过滤, 哪些对会被过滤?中间出现可显示的字符就不用过滤它?共(\s*((?(o)\<).*(?(-o)\>)\s*[^\w]+\s*)*\s*)*产党(?(o)(?!))(?(o)(?!)) (?#如果还有<剩余就不匹配任何东西)
这三个字中间出现任何在<>之外的字符
比如 共a产党
都被视为非 "共产党"
而如果出现 <a>共<strong>产</strong>党</a>
则被视为 "共产党" 要被过滤掉.
总之不用被用户直接看到有 "共产党" 三个字连在一起的.