我有些带html标记的文档,我需要个正则表达式来匹配一些html标记
我需要保留<p></P><a href=""></a><img /><table><tbody><tr><td></table></tbody></tr></td><br/>其余的标记全部删除,我需要不能匹配以上标记的正则表达式
谢谢

解决方案 »

  1.   

    此回复为自动发出,仅用于显示而已,并无任何其他特殊作用
    楼主【al_you_ge】截止到2008-06-24 15:49:56的历史汇总数据(不包括此帖):
    发帖数:1                  发帖分:100                
    结贴数:1                  结贴分:100                
    未结数:0                  未结分:0                  
    结贴率:100.00%            结分率:100.00%            
    敬礼!
      

  2.   

    如果所要匹配的就是开始的 H1 标记,则下述非贪婪地表达式就只匹配 <H1>。/<.*?>/
    或者"<.*?>"
      

  3.   

    <\/?(p|a|img|table|tr|td|tbody|br).*?>
    这个的补集,补集怎么写忘了
      

  4.   


    <(\S*?)[^>]*>.*?|<.*? />
      

  5.   


    String pattern = "\\<\\/?(?!p|a|img|br|t(?:able|body|r|d)\\s\\>)[^>]+?\\>";
      

  6.   

     改一下:
    String pattern = "\\<(?!/?(?:p|a|img|br|table|tbody|tr|td)[\\s\\>])[^>]*?\\>";