程序后台已经获取到网页的所有源码,里面有个div如下:
<div class="wm_sktq_l">.......</div>
这个div内包含多个div又包含多个p标签   现在我想获取这个div之内的所有p标签,请问该如何做?尽量详细些,最好将结果整成数组或集合,能够通过下标获取对应的p标签内容。

解决方案 »

  1.   

    使用HtmlParser解析
      

  2.   

    加载到XmlDocument,查找p子节点(XPath),如果要在子节点内继续查找,用递归
      

  3.   

    我数据是从外网上抓取的,好像不能加载到XmlDocument中吧
      

  4.   

    可以的,有个LoadXml()方法,参数是string类型,相关的方法(比如SelectSingleNode和SelectNodes)上MSDN(百度也行)去查一下
      

  5.   

    string patten_block="<div class=\"wm_sktq_l\">[\\s\\S]*</div>"string patten_p="<p>[\\s\\S]*</p>" 用组获取。
      

  6.   

    $("div p"),至于你要做什么事,你循环多少个P标签取出里面的 text()