带HTML文章摘要的截取

一篇文章，带HTML标记的，我现在要截取文章的前面多少多少作为一个摘要，但是我要去掉里面所有的样式性的标记，只保留格式行的标记（如 br等等）；
去掉标记的屁股的时候要连带去掉标记的头高手指点～～

给你一个思路
放在
<span id="spanSummary" runat="server"></span>
里面，
然后
spanSummary.innerText = pageText;
spanSummary.innerText = spanSummary.InnerText.Substring(0,50) + "....";
去掉<>之间的字符：
  string   summary=Regex.Replace(intput,@"<.*?>","",RegexOptions.Compiled|RegexOptions.IgnoreCase);
spanSummary.InnerHTML = pageText;
spanSummary.InnerText = spanSummary.InnerText.Substring(0,50) + "....";
我现在已经把<>里的字符去掉了，但是这样还是不对，这样就连带的把换行标记也去掉了
我是要去掉HTML标记。但是只保留换行的HTML标记