1)用上网的通用匹配html的正则<(S*?)[^>]*>.*?|<.*? />,可以去掉大部分的代码,但这样的代码去不掉(10℃~11℃ / 50°F~52°F" rc="htt://xx.xxx.c/weather_img/14.gif">)原来代码是这样的(<TD id=bc898115 class=ht><IMG title="多云<br>10℃~11℃ / 50°F~52°F" rc="htt://xx.xxx.c/weather_img/14.gif"></TD>)
请问怎样才可以一起去掉。
请问怎样才可以一起去掉。
<(S*?)[^>]*>.*|<.*? />
string str = File.ReadAllText("D:\\1.txt", Encoding.Default);
str = Regex.Replace(str, @"(?is)<((?<g><)|(?<-g>>)|[^<>])*(?(g)(?!))>", "");
<((?<Open><)|(?<-Open>>)|[^<>])*(?(Open)(?!))>参考
http://blog.csdn.net/lxcnn/article/details/4402808