我想把正文里面的标签都去掉,请问这个该怎么解决啊,我想应该是用正则吧。正文如下:
<P><FONT face=宋体 size=3>  10月31日,湖北省网络发票应急(离线)开具系统鉴证会在黄石召开。省地税局技术管理处主持了鉴证会。省地税局副局长肖厚雄,办公室、征管处有关负责同志,武汉市、黄石市、宜昌市、襄樊市分管征管工作的局领导及武汉大学、东软公司的专家共20多人参加了会议。</FONT></P>
<P><FONT face=宋体 size=3>  会上,由地税系统、武汉大学、东软公司联合组成的评审组,经过软件演示、现场交流、网络发票应急(离线)开具系统试点用户实地开具等评审环节后一致认为:该系统设计理念先进,安全措施完善,控制措施严密,实现了在网络极端条件下,纳税人网络发票的正常开具与控制;该系统通过一系列科学的加密机制,有效地保证了数据安全;该系统给纳税人的经营提供了方便,也将产生明显的经济效益和社会效益;该系统在全国同类系统设计中居领先水平,具备在全省进行推广的条件。</FONT></P>
<P>&nbsp;</P>
<P align=center><IMG src="/cms/homepage/images/content/2010/20101222103505769844.jpg" border=0 orig="离线1.jpg"></P>
<P align=center>&nbsp;</P>
<P align=center>湖北省网络发票应急(离线)开具系统鉴证会现场</P>
<P align=center>&nbsp;</P>
<P align=center><IMG src="/cms/homepage/images/content/2010/20101222103512798985.jpg" border=0 orig="离线2.jpg"></P>
<P align=center>&nbsp;</P>
<P align=center>网络发票应急(离线)开具系统试点用户实地开具发票 </P>

解决方案 »

  1.   

    System.Text.RegularExpressions.Regex.Replace(strInput, "<[^<>]*?>"," ");
      

  2.   


    /// <summary>
        /// 去掉html标记
        /// </summary>
        /// <param name="str"></param>
        /// <returns></returns>
        protected static string ConvertGettext(string str)
        {
            Regex regex = new Regex(@"\<(.*?)\>", RegexOptions.IgnoreCase);        return regex.Replace(str, "").Replace("&nbsp;", "").Replace("\n", "").Replace("\r", "");
        }