我在做文章系统的时候要过滤掉一些字符.
比如 钓鱼岛 什么的.只是 钓鱼岛 倒好办,但如果是 
<font>钓</font>鱼岛 
或者
<a href="">钓<strong>鱼</strong>岛</a>我应该怎么过滤呢?

解决方案 »

  1.   


       如果只是HTML也不难过滤,因为有一定的特征,都过滤就行了,难的是还有别的字符如:    钓_鱼_岛   钓*鱼*岛   “钓”“鱼”“岛”   ~~钓~鱼~岛~~    钓~~~~~~鱼。岛   钓·鱼¥岛  钓*—鱼&岛 钓...鱼.....岛 
        要举出多少都行,没有办法都过滤掉的,只是尽量过滤就行了。
      

  2.   

    <a href="">钓<strong>鱼</strong>岛</a>
    用正则表达式
    像钓_鱼_岛   钓*鱼*岛   “钓”“鱼”“岛”   ~~钓~鱼~岛~~    钓~~~~~~鱼。岛   钓·鱼¥岛  钓*—鱼&岛 钓...鱼.....岛 这样的,就不好弄了
      

  3.   

    Regex.Replace(inputtext,@"共(?<A>(<[^>]*>)+)産(?<B>(<[^>]*>)+)党","${A}${B}");--------------------------------------------------------------------------------
    輸入:23共12産,69党***************** 共<4><oi>産</d>9<oplk>党23
    輸出:23共12産,69党***************** 共<4><oi>産</d>9<oplk>党23
    ---------------------------------------------------------------------------
    輸入:23共12産,69党***************** 共<4><oi>産</d><oplk>党23
    輸出:23共12産,69党***************** <4><oi></d><oplk>23
    ------------------------------------------------------------------
    輸入:<a href="">共<strong>産</strong>党</a>
    輸出:<a href=""><strong></strong></a>
    -------------------------------------------------------
    輸入:<a href="">共你<strong>産</strong>党</a>
    輸出:<a href="">共你<strong>産</strong>党</a>
    --------------------------------------------------------------------
    这样不知道是不是你想要的
      

  4.   

    TO: kkbspod(我被可乐淹死了)你的方法虽然没有过滤掉HTML标签.
    但目的已经实现.
    不过你能不能再想一想把HTML标签也过滤掉呢?谢谢啦...请到其它两个贴里一起收分.
      

  5.   

    另外两个贴子的地址是:http://community.csdn.net/Expert/topic/5144/5144605.xml?temp=.5946161
    http://community.csdn.net/Expert/topic/5145/5145308.xml?temp=.7716791