需要从网页中抓取信息, 目前使用的webBrowser,但是发现里面的DIV很多,并且没有ID,Name这些属性,只有Class, 请问怎么抓取到我想要的那个DIV中的内容。

解决方案 »

  1.   

    在JS下是可以通过tagname(就是DIV这个标签名)获取的,然后再遍历这些div找到符合条件的div
    不知道winform下怎么实现。
      

  2.   

    你都可以遍历了DIV了,到了这个程度,其它说法有没有理解你的意思,你自己还不清楚嘛?!如果你自己也说不出来什么DIV是你要的DIV,别人也只能放空话。
      

  3.   


    lz已经遍历出所有HtmlElement包括所有DIV了。
      

  4.   


    比如你可以说“我想要的那个DIV就是第51个DIV”,或者“我想要的那个DIV就是书写字符大于40个char的DIV”,或者“我想要的那个DIV就是我经常用鼠标在上面划过的DIV”,等等,总之你要给出一个“我想要的那个DIV”的概念出来,不能像小孩子一样张着小手可是说不出来。
      

  5.   

    没有id是很不好的。但是可以按照ls说的那样,通过元素的相对位置确定。元素和元素的关系是“前”、“后”、“上”、“下”四个的组合。你可以选择一个最临近的元素(有id的)作为参照,按照相对次序找到这个元素。
      

  6.   


    嗯,只有按照caozhy说的那样去获取。在网上查了下, 有3种方式, htmlrequest, webclient 和 webbrowser, htmlrequest要会的东西比较多,webclient 适中, webbrowser是相对比较容易的,加载页面后使用webbrowser.document, 获取信息,然后和解析XML差不多去分析出想要的数据.
      

  7.   

    用JQ吧  不用遍历很简单 $('div:eq(你的索引)').find(其他内容随便抓取)
      

  8.   

    用jquery吧. 很方便 的。。$("#id").html() 有ID的。$(".class") 通过class查找。