html标签排除   1、<a     超连接排除
   2、<div   层排除
   3、<br    换行符
   4、<span
   5、<table
   6、<b
   7、<tr
   8、<tbody
   9、<td
   10、<img
   11、<p
   12、&nbsp
   13、<font
   14、<scripthtml标签排除

解决方案 »

  1.   

    @"<img\s*src\s*=\s*[""']?.+\s*.(gif|jpg|bmp|tif|png)\s*.+(\/>|<\/img>)"
      

  2.   

    过客本周回家,暂别CSDN,先说下你需求,我来解决
      

  3.   

    试试这样 @"\<(a|span|div|table|font|script|p|td)\s+.*?\>"
      

  4.   

    regex.replace("<a|<div|<br|<span|<table|<b|<tr|<tbody|<td|<img|<p|\&nbsp|<font|<script","")
      

  5.   

    <(a|div|span|b|tr|td|tbody|td|img|p|font|script)[^>]*[\s\S]*>[^<]*[\s\S]*</(\1)>|<br>|&nbsp
      

  6.   


    @"<(a|span|div|table|font|script|p|td)\s+.*?(\/>|<\/img>)"
      

  7.   


    @"<(a|span|div|table|font|script|p|td)\s+.*?(\/>|<\/(a|span|div|table|font|script|p|td)>)"
      

  8.   

    string strSrc = "<div fdaffdsfds>fdsfdsf</div>\r\n<a href = \"fdsfd.htm\">fdsf</a>\r\n<br>\r\n&nbsp";
    strSrc = Regex.Replace(strSrc, @"<(a|div|span|b|tr|td|tbody|td|img|p|font|script)[^>]*[\s\S\r\n]*>[^<]*[\s\S\r\n]*</(\1)>|<br>|&nbsp", "", RegexOptions.IgnoreCase);
      

  9.   

    不是太明白楼主的意思,是全部过滤掉,还是根据某一配置文件之类的,动态确定需要过滤的内容,如果是前者,用下面的,其中12、&nbsp应该是12、&nbsp;吧,如果是全部过滤,可以写在一起,否则这个单独处理吧,这个可以不用正则的string yourStr = ............;
    string result = Regex.Replace(yourStr, @"<(a|div|br|span|table|b|tr|td|tbody|img|p|font|script)[^>]*>", "", RegexOptions.IgnoreCase);
    如果是后者,先读到一个集合,比如List<string>里,然后用StringBuilder拼接字符串,用“|”隔开,得到最终的正则表达式,再进行过滤就可以了
      

  10.   

    对于&nbsp;可以用Replace先替换掉string yourStr = ...............;  //源字符串
    //这个集合是动态获得的
    List<string> list = new List<string>(new string []{"a","div","br","span","table","b","tr","td","tbody","img","p","font","script"});
    StringBuilder pattern = new StringBuilder();
    pattern.Append("<(");
    foreach (string s in list)
    {
        pattern.Append(s);
        pattern.Append("|");
    }
    pattern.Remove(pattern.Length - 1, 1);
    pattern.Append(")[^>]*>");
    Regex reg = new Regex(pattern.ToString(), RegexOptions.IgnoreCase);  //生成的正则表达式
    string result = reg.Replace(yourStr);  //进行替换如查不能保证list不为空,拼接之前加一个if(list.Count>0)的判断
      

  11.   

    sorry,最后这行写错了string result = reg.Replace(yourStr, "");