我有一个应用是用程序来获取网页上的全部文字,网页是由数据库动态生成的,我只想把文字保存到我的数据库中.就像是CATR+A全选之后再复制所有文字到剪贴板这个效果,然后我再分析获得的文字按字段存入我自己的数据库中.看论坛上的相类似的帖要求不一,我不懂HTML,所以想个完整点的代码学习一下.
解决方案 »
- 如何在mfc下利用opengl画图啊
- 大家好,请问怎样对CUP卡进行操作,如读,写。
- 打开文件对话框与控件之间的消息传递
- MFC中CView和CFrameWnd的问题
- 在一个按钮事件中画了一个图形,最小化窗口后再还原无法显示?
- 为什么在对话框中弹出右键菜单,无效的菜单条目仍然黑色显示?
- 【SDI工程】将CFormView派生类放入CDailogEx派生类中,显示正常但单击跳出错误
- 跪求旧版的MSDN 和 Xtreme Toolkit !!!!!
- 如何改变编辑框中字体的颜色?
- 如何得到当前运行程序的全路径?
- WriteFile如何实现异步写入?
- Google公司2007年最新的两道C++面试题,有兴趣的朋友来看看,看你能不能做对!
创建一个socket请求这个动态网页就可以了
先用IE控件载入这个网页
然后:
下面这段代码放在文档接收完成的 OnDocumentComplete 事件函数里
LPDISPATCH lpDispatch;
lpDispatch = m_webBrowser.get_Document();
if (lpDispatch)
{
HRESULT hr = lpDispatch->QueryInterface(IID_IHTMLDocument3,
(LPVOID*)&pHTMLDoc3);
lpDispatch->Release();
ASSERT(SUCCEEDED(hr));
}
CString strHtmlText;
IHTMLElement* pDocElem;
hr = pHTMLDoc3->get_documentElement(&pDocElem);
pHTMLDoc3->Release();
ASSERT(SUCCEEDED(hr));
pDocElem->get_innerText(strHtmlText);
pDocElem->Release();
这样得到的strHtmlText就是网页的文本。