谁有这方面的资料?

解决方案 »

  1.   

    http://www.microsoft.com/china/msdn/Archives/workshop/scrape.asp
      

  2.   

    一直在寻找一个轻量级的HTML解析类,可惜没有找到合适的。据说在微软泄露的win2000代码里有,估计很复杂。有达人说可以参考下列的东东:
    1。boost spirit,有例子已经做好的如何解析html;
    2。mshtml parsing ;
    3。http://tidy.sourceforge.net/
    以前作搜索引擎的时候用过,用的是java接口,它也有C++的接口
      

  3.   

    FrieFox 的源码很能说明问题
      

  4.   

    用com接口IHTMLDocument/IHTMLElement
      

  5.   

    http://www.codeproject.com/internet/parse_html.asp