关于用正则匹配HTML指定的内容

<tbody><tr>
           <td align="right"> 2012-05-04   17:29:00
           </td>
           <td class="middle_border">丽水市莲都区速递物流分公司莲都揽投部</td><td>
           </td>
       </tr>
       <tr>
           <td class="backcolor" align="right">2012-05-04   18:44:43
           </td>
           <td class="backcolor middle_border" align="center">丽水市
           </td>
           <td class="backcolor" align="center">

请问下如何用正则匹配出里面的表的信息    2012-05-04   17:29:00
        丽水市莲都区速递物流分公司莲都揽投部
                                                2012-05-04    18:44:43
                                                丽水市

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

(?is)(?<=<td[^>]*?>).*?(?=</td>)取m.Value
string input="你的HTML代码";
string pattern="(?is)(?<=<td[^>]*?>).*?(?=</td>)";
List<string> list=new List<string>();
foreach(Match  m in Regex.Matches(input，pattern))
{
    list.Add(m.Value);//list中就是你要的
}
string tempStr = File.ReadAllText(@"C:\Users\M\Desktop\Test.txt", Encoding.GetEncoding("GB2312"));
            string pattern = @"(?<=<tbody>[\s\S]*?<tr>[\s\S]*?<td[^>]*?>\s*)((?!</td>)[^\s])+";            foreach (Match m in Regex.Matches(tempStr, pattern))
            {
                string result = m.Value;//循环输出
            }
第一步先把一段字符替换正则替换[\n\t\r\b]    完成后用Regex.Matches(替换完成源码) 返回你一个集合你就可以用了
我不知道你干什么用。但是有一点我很清楚，假设你稍微需要一点靠谱的所谓分析，那么就不要在这个问题上依赖什么正则，而应该使用真正的html语法解析程序。正则能够对语法进行解析吗？不能。
在你这个问题上可以看出，正则就是“傻了吧唧地”匹配字符。那么假设有些字符是在引号括起来的属性内容中的，有些甚至根本不是合法的html，等等其他格式，正则能区分出来么？它给你的不是乱七八糟的结果嘛。