请问如何用正则表达式过滤掉html标志？

比如
原始文本为：
<table width="500" border="0" cellspacing="0" cellpadding="0">
     <tr align="center">
      <td valign="top" >百美公司版权所有</td>
<hr>天下第一刀
    </tr>  </table> 希望显示为：百美公司版权所有　天下第一刀
也就是把网页标志全部过滤掉

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

很简单：
>([^>]*)</取出Mach.Group(1)即得到文本,所有匹配的文本就是你最后得到的。
string s = "....";
s = System.Text.RegularExpressions.Regex.Replace(s, @"<[^>]+>","");
http://community.csdn.net/Expert/topic/3095/3095876.xml?temp=9.395999E-02
谢谢各位，我还有一事，我想在一个健结果中瘵关键字肥白显示，
比如关键字为　　“Test”则将来显示时原始字串中包含“Test”的部分（html标志已成功过滤掉)替换为<font style='background-color:#ffff66'>Test</font>现在显示结果出来了！但是原来的Html格式都没有了！全部成了普通文本请问怎样再还原原来的格式　并将替换文本也加进去？？
替换已解决！　但是还有一全问题该正则表达式将两类特殊表达式也过滤了！《scriptlanguage ………></script>还有嵌套标志请问能否过滤掉除这两类之外的其它所有Html标志？？
your requirement is a little weird, since people normally want to get rid of <script>, but try
s = System.Text.RegularExpressions.Regex.Replace(s, @"<(?!/?script|\!--)[^>]+>","", RegexOptions.IgnoreCase);
安思归的作法，可以实现。
我的作法是提取出文本，他的作法是替换调标签。使用s = System.Text.RegularExpressions.Regex.Replace(s, @"<(?!/?script|\!--)[^>]+>","", RegexOptions.IgnoreCase);
可以先把脚本去掉。
，然后提取文本，还是去处标签，你都能得到网页文本。