一篇文章,带HTML标记的,我现在要截取文章的前面多少多少作为一个摘要,但是我要去掉里面所有的样式性的标记,只保留格式行的标记(如 br等等);
去掉标记的屁股的时候要连带去掉标记的头高手指点~~

解决方案 »

  1.   

    给你一个思路
    放在
    <span id="spanSummary" runat="server"></span>
    里面,
    然后
    spanSummary.innerText = pageText;
    spanSummary.innerText = spanSummary.InnerText.Substring(0,50) + "....";
      

  2.   

    去掉<>之间的字符:   
      string   summary=Regex.Replace(intput,@"<.*?>","",RegexOptions.Compiled|RegexOptions.IgnoreCase);
      

  3.   

    spanSummary.InnerHTML = pageText; 
    spanSummary.InnerText = spanSummary.InnerText.Substring(0,50) + "....";
      

  4.   

    我现在已经把<>里的字符去掉了,但是这样还是不对,这样就连带的把换行标记也去掉了
    我是要去掉HTML标记。但是只保留换行的HTML标记