看到好多关于提取网页数据的,但是用VC的真的不多。我想做一个工具能提取网页上特定的数据,例如检索到网页上包含某一特定内容后就把后面的一定数据提取出来,请问我该如何入手?敬请各位指点!

解决方案 »

  1.   

    我想用WebBroswer控件  不知道能不能实现全部功能。又该如何实现呢?
      

  2.   

    1、发http请求,获取网页html文档
    2、进行必要的编码转换
    3、字符串搜索定位
      

  3.   

    我做过,使用CHttpFile获取网页源文件,然后再逐行解析提取
    CHttpFile的用法在MSDN中有现成示例 DWORD dwServiceType = AFX_INET_SERVICE_HTTP;
    CString   szServer, szObject;
    INTERNET_PORT nPort;
    AfxParseURL(cURL, dwServiceType, szServer, szObject, nPort); pConnection = session.GetHttpConnection(szServer,
    INTERNET_FLAG_KEEP_CONNECTION, INTERNET_INVALID_PORT_NUMBER|uFlag, NULL, NULL);
    pFile = pConnection->OpenRequest(_T("GET"), szObject, NULL, 0, NULL, NULL,
    INTERNET_FLAG_KEEP_CONNECTION|INTERNET_FLAG_NO_AUTO_REDIRECT|uFlag);
      

  4.   

    我已经有webbrowser 中的 documenttext 获取到了Html 但是获取到得东西有些有乱码,主要就是那个中文的数据 不知道怎么解决,能给个办法吗 ?