如题,以前没有接触过网页编程,而这个任务又很急,用CHttpFile的ReadString得到了网页的内容,如何把全部纯文本提取出来?利用正则表达式?给出资料来源或者源码就好,我自己去研究,多谢~

解决方案 »

  1.   

    //如何把全部纯文本提取出来这样的要求,可能有点儿不对,不过你可以google 关键词 正则 vc html标签http://topic.csdn.net/u/20080317/23/c578f807-4163-4711-90cf-a4d068c55bb7.html
      

  2.   

    楼主到底要得到什么,不是已经ReadString得到了网页的内容,
    你说的得到纯文本,是什么意思,
      

  3.   

    估计楼主说的是 浏览器显示出来的文字... 不包括 tag, 图片等使用CHtmlViewIHTMLDocument2::get_body
    IHTMLElement::get_innerText
      

  4.   

    得用正则表达式来解析
    开源PCRE,下载地址:http://download.chinaunix.net/download/0008000/7913.shtml