如题,已经将指定URL的网页内容读取到一个CString对象中了,如何从中提取出我想要的文字信息呢,求大哥大姐们指点小弟一下。

解决方案 »

  1.   

    土一点的用CString::Find/Mid/Left/Right()
    高级一点用正则表达式
      

  2.   

    建议用正则表达式.从VS2008的SP1开始,VC就支持BOOST库的正则表达式了
      

  3.   

    用html parser,比如MSHTML, 参考
    Lightweight HTML Parsing Using MSHTML
    Web Development Archives: WebBrowser and MSHTML
      

  4.   

    能给点具体的方法吗?比如用boost正则表达式,或者是网页解析,小弟刚学不久,谢谢各位了!!补充一下问题:比如有下面的代码:
      <body>
    <dd><a href="/news/gamenews/20110923/62373.shtml" target="_blank">教你如何变成《完美国际》高手 PWIC最强战队做客完美电台</a>2011-09-23</dd>
    <dd><a href="/news/gamenews/20110922/62340.shtml" target="_blank">完美世界(国际)电台每周六点卡大派送!只要你“挑战冷老师”!</a>2011-09-22</dd>
    <dd><a href="/news/gamenews/20110922/62332.shtml" target="_blank">决战金秋 完美世界携多款巨制进军2011金翎奖</a>2011-09-22</dd>
    <dd><a href="/news/gamenews/20110921/62312.shtml" target="_blank">《完美国际》第二期首杀活动获奖名单公布</a>2011-09-21</dd>
    <dd><a href="/news/gamenews/20110921/62291.shtml" target="_blank">喜迎三周年 完美商城全新升级重装待发</a>2011-09-21</dd>
    <dd><a href="/news/gamenews/20110919/62257.shtml" target="_blank">投票抢好礼 完美世界2011金翎奖势在必得</a>2011-09-19</dd>
    <dd><a href="/news/gamenews/20110915/62222.shtml" target="_blank">《完美国际》全服首杀活动获奖名单</a>2011-09-15</dd>
    <dd><a href="/news/gamenews/20110915/62219.shtml" target="_blank">《完美国际》全新时装一秒Hold住全场</a>2011-09-15</dd>
    <dd><a href="/news/gamenews/20110909/62101.shtml" target="_blank">《完美国际》花前月下话中秋</a>2011-09-09</dd>
    <dd><a href="/news/gamenews/20110909/62090.shtml" target="_blank">文化创意产业突飞猛进 完美世界全球化发展再获肯定</a>2011-09-09</dd>
    <dd><a href="/news/gamenews/20110908/62080.shtml" target="_blank">《完美国际》中秋佳节好事成双</a>2011-09-08</dd>
    <dd><a href="/news/gamenews/20110907/62062.shtml" target="_blank">《完美国际》酬劳加倍 重金赏猎人</a>2011-09-07</dd>
    </body>
    怎么样从中间提取出汉字新闻呢?
      

  5.   

    搜索所有 <>中的字符串,并删除。
    CString.Find(L"<")
    CString.Find(L">")
    CString.Replace();
      

  6.   

    问题已解决,chinatcp 的帮助很大,也谢谢所有朋友