<tbody><tr>
           <td align="right"> 2012-05-04&nbsp;&nbsp;&nbsp;17:29:00
           </td>
           <td class="middle_border">丽水市莲都区速递物流分公司莲都揽投部</td><td>
           </td>
       </tr>
       <tr>
           <td class="backcolor" align="right">2012-05-04&nbsp;&nbsp;&nbsp;18:44:43
           </td>
           <td class="backcolor middle_border" align="center">丽水市
           </td>
           <td class="backcolor" align="center">

 请问下如何用正则匹配出里面的表的信息    2012-05-04   17:29:00
        丽水市莲都区速递物流分公司莲都揽投部
                                                2012-05-04    18:44:43
                                                丽水市

解决方案 »

  1.   

    (?is)(?<=<td[^>]*?>).*?(?=</td>)取m.Value
      

  2.   

    string input="你的HTML代码";
    string pattern="(?is)(?<=<td[^>]*?>).*?(?=</td>)";
    List<string> list=new List<string>();
    foreach(Match  m in Regex.Matches(input,pattern))
    {
        list.Add(m.Value);//list中就是你要的
    }
      

  3.   

    string tempStr = File.ReadAllText(@"C:\Users\M\Desktop\Test.txt", Encoding.GetEncoding("GB2312"));
                string pattern = @"(?<=<tbody>[\s\S]*?<tr>[\s\S]*?<td[^>]*?>\s*)((?!</td>)[^\s])+";            foreach (Match m in Regex.Matches(tempStr, pattern))
                {
                    string result = m.Value;//循环输出 
                }
      

  4.   

    第一步 先把一段字符替换 正则替换[\n\t\r\b]    完成后用Regex.Matches(替换完成源码) 返回你一个集合 你就可以用了
      

  5.   

    我不知道你干什么用。但是有一点我很清楚,假设你稍微需要一点靠谱的所谓分析,那么就不要在这个问题上依赖什么正则,而应该使用真正的html语法解析程序。正则能够对语法进行解析吗?不能。
      

  6.   

    在你这个问题上可以看出,正则就是“傻了吧唧地”匹配字符。那么假设有些字符是在引号括起来的属性内容中的,有些甚至根本不是合法的html,等等其他格式,正则能区分出来么?它给你的不是乱七八糟的结果嘛。