vc下如何提取网页文本? 如题,以前没有接触过网页编程,而这个任务又很急,用CHttpFile的ReadString得到了网页的内容,如何把全部纯文本提取出来?利用正则表达式?给出资料来源或者源码就好,我自己去研究,多谢~ 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 //如何把全部纯文本提取出来这样的要求,可能有点儿不对,不过你可以google 关键词 正则 vc html标签http://topic.csdn.net/u/20080317/23/c578f807-4163-4711-90cf-a4d068c55bb7.html 楼主到底要得到什么,不是已经ReadString得到了网页的内容,你说的得到纯文本,是什么意思, 估计楼主说的是 浏览器显示出来的文字... 不包括 tag, 图片等使用CHtmlViewIHTMLDocument2::get_bodyIHTMLElement::get_innerText 得用正则表达式来解析开源PCRE,下载地址:http://download.chinaunix.net/download/0008000/7913.shtml 如何用AppFace更改基于对话框应用程序的主题呢? VS2005(VC++) 想用 DirectShow 写WinCe上的东西(播放器), 要如何配置DirectShow ? 如何查看MFC的源代码? 如何把一个24位的位图转换成一个单色的TIFF 如何判断输入的是否为合法的性别? 控制台应用程序怎样在启动时最小化?在线等 奇怪!!! 急!!! 请问在MFC中我如何设置对话框的最小范围 还是关于如何获得Windows可执行程序的版本信息问题? 请问如何通过按键调节滚动条的位置 急!在线等。IE浏览器中无法正确使用自己做的ocx插件
你说的得到纯文本,是什么意思,
IHTMLElement::get_innerText
开源PCRE,下载地址:http://download.chinaunix.net/download/0008000/7913.shtml