<td class="csDE61D2B3" style="width:103px;height:25px;text-align:left;vertical-align:middle;" colspan="8">订货地点:</td>
<td class="csDE61D2B3" style="width:169px;height:25px;text-align:left;vertical-align:middle;" colspan="5">[1361]高新区店&nbsp;&nbsp;&nbsp;/</td>
<td class="csDE61D2B3" style="width:88px;height:25px;text-align:left;vertical-align:middle;" colspan="2">采购订单号:</td>
<td class="csDE61D2B3" style="width:187px;height:25px;text-align:left;vertical-align:middle;" colspan="7">4510081735</td>
<td class="csDE61D2B3" style="width:92px;height:25px;text-align:left;vertical-align:middle;" colspan="3">商品凭证号:</td>
<td class="csDE61D2B3" style="width:161px;height:25px;text-align:left;vertical-align:middle;" colspan="6">&nbsp;</td>知道url如何把这样的页面中的数据提取出来啊?正则怎么写啊?

解决方案 »

  1.   

    //是要获取class=csDE61D2B3的td里面的内容?
                string str = "<td class=\"csDE61D2B3\" style=\"width:103px;height:25px;text-align:left;vertical-align:middle;\" colspan=\"8\">订货地点:</td>"
                    +"<td class=\"csDE61D2B3\" style=\"width:169px;height:25px;text-align:left;vertical-align:middle;\" colspan=\"5\">[1361]高新区店&nbsp;&nbsp;&nbsp;/</td>"
                    +"<td class=\"csDE61D2B3\" style=\"width:88px;height:25px;text-align:left;vertical-align:middle;\" colspan=\"2\">采购订单号:</td>"
                    +"<td class=\"csDE61D2B3\" style=\"width:187px;height:25px;text-align:left;vertical-align:middle;\" colspan=\"7\">4510081735</td>"
                    +"<td class=\"csDE61D2B3\" style=\"width:92px;height:25px;text-align:left;vertical-align:middle;\" colspan=\"3\">商品凭证号:</td>"
                    +"<td class=\"csDE61D2B3\" style=\"width:161px;height:25px;text-align:left;vertical-align:middle;\" colspan=\"6\">&nbsp;</td>";
                Regex reg = new Regex(@"<td[^>]*?class=(['""\s]?)csDE61D2B3\1[^>]*?>(?<content>((?!</?td).)*)");
                MatchCollection match = reg.Matches(str);
                foreach (Match m in match)
                {
                    Response.Write(m.Groups["content"].Value + "<br/>");
                }
    /*
    订货地点:
    [1361]高新区店   /
    采购订单号:
    4510081735
    商品凭证号:
    */
      

  2.   

    @"<td[^>]*?class=(['""\s]?)csDE61D2B3\1[^>]*?>(?<content>((?!</?td).)*)"
      

  3.   

    如果要获取<td>和</td>之间的文本。那么就用<td[\\s\\S]+?>(?<text>[\\s\\S]*?)</td>
    Groups["text"]就是中间的文本了。