<tr id="tr13793" style="display:none">
    <td>
        <table>
            <tr>
                <td>测试</td>
            </tr>
        </table>
    </td>
    <td>
        <table>
            <tr>
                <td>测试</td>
            </tr>
        </table>
    </td>
    <td>
        <table>
            <tr>
                <td>测试</td>
            </tr>
        </table>
    </td>
    <td>
        <table>
            <tr>
                <td>测试</td>
            </tr>
        </table>
    </td>
</tr>问下大家,这段代码应该怎么抓取,我要抓取的是从<tr id="tr13793" style="display:none">开始到最后一个</tr>结束,而我现在抓取的数据只能抓到第一个<table>的</tr>,下面的数据没了,显然这不符合要求,问下各位有没有更好的办法,抓取到一整块

解决方案 »

  1.   

    你的网页是符合xhtml规范的吗?如果是的那就比较好处理了,先把整个页面用xmldocument加载,然后用xpath去查找,就能找到你要的html了
      

  2.   

    xpath什么意思,能说下吗,具体怎么弄能详细点吗?
      

  3.   

    你下一个tr的开头是什么样的?
    如果也是 <tr id="tr13793" style="display:none">
    那么你就可以到下一个tr的开头
      

  4.   

    好的下面就是我抓取的代码,其中\042是双引号
    string pattern2 = @"<tr id=\042tr\d\d\d\042 style=\042display: none\042>(?<Content>[\s\S]+?)</tr>";