我有一个字符串是从一个html页面里读取的怎样才能把里面包含的html标签替换掉,只留下html里面的内容呢.
我对c#中使用正则表达式替换还不是很熟,请大家给点代码参考一下好吗?

解决方案 »

  1.   

    string regexStr = @"<[^>]+>";string temp = Regex.Replace(yourStr, regexStr, String.Empty);//
      

  2.   

    一般去的都是html的标签。。也就是<>里面的内容。。
    所以可以这样写:Regex reg=new Regex(@"<.*?>",RegexOptions.Singleline);
    string output=reg.Replace("html代码……","");
      

  3.   

    要是只保留<img.....>里面的东西该怎摸写呢啊.
      

  4.   

    Regex reg=new Regex(@"<[^(img)].*?>",RegexOptions.Singleline);
    string output=reg.Replace("html代码……","");这样应该可以。。不过我没有测试。。你可以试试看。。