采用webbrowers控件如何提取html中的文本内容?示例:
html文件:   <TD class=text_b_12_1 style="PADDING-LEFT: 30px" colSpan=2 
      height=30><STRONG>第一卷 六院风云 第一集</STRONG></TD></TR>
  <TR>
    <TD class=text_o_12_2 align=middle colSpan=2 height=50><STRONG>序章 
      七界传说</STRONG></TD></TR>
  <TR>
    <TD class=text_b_14_1 colSpan=2>
      <P>中华大地,山川秀丽,数千年来,在这片土地上,流传着无数的神奇传说。千古以来,一直被人们津津乐道的便是那些关于长生不老,永生不死的传奇。自古以来,凡人无不有一死。但世人皆恶死爱生,更有地府阎罗之说,平添了几分苦惧,在此之下,遂有长生不死之说,令世人梦寐以求,纷纷苦寻长生之路。<SPAN 
      class=transparent>(来自·幻剑书盟)</SPAN></P>
 
将它提取后成为
七界传说
中华大地,山川秀丽,数千年来,在这片土地上,流传着无数的神奇传说。千古以来,一直被人们津津乐道的便是那些关于长生不老,永生不死的传奇。自古以来,凡人无不有一死。但世人皆恶死爱生,更有地府阎罗之说,平添了几分苦惧,在此之下,遂有长生不死之说,令世人梦寐以求,纷纷苦寻长生之路。
谢谢了!非常急。

解决方案 »

  1.   

    没必要用webbrowers,用wininet就行了,然后用正则
      

  2.   

    IHTMLElement::innerText 或像楼上说的一样。
      

  3.   

    自己解析
    <>***<> 之间的留下就可以了
      

  4.   

    我也同意楼上自己解析,CString find几下就出来了吧,
      

  5.   

    仔细google,baidu网上一搜一大把代码
      

  6.   

    用DOM直接取text应该是比较轻量级的解决方案
      

  7.   

    const string  ExtractHTML( const string& strHTML )
    {
    string strTemp = strHTML;
    while( true )
    {
    size_t szPos = strTemp.find( "<" );
    if( string::npos == szPos )
    return strTemp;
    size_t szEnd = strTemp.find( ">", szPos );
    if( string::npos == szEnd )
    return strTemp;
    strTemp.erase( szPos, szEnd - szPos + 1 );
    }
    }
      

  8.   

    study the walkall sample in MSDN
    http://msdn.microsoft.com/archive/default.asp?url=/archive/en-us/samples/internet/browser/walkall/default.asp
      

  9.   

    const string  ExtractHTML( const string& strHTML )
    {
    string strTemp = strHTML;
    while( true )
    {
    size_t szPos = strTemp.find( "<" );
    if( string::npos == szPos )
    return strTemp;
    size_t szEnd = strTemp.find( ">", szPos );
    if( string::npos == szEnd )
    return strTemp;
    strTemp.erase( szPos, szEnd - szPos + 1 );
    }
    }
    ---------------------------
    请教:下面的HTML代码利用这个函数解析出来的是什么东东?
    <pre>
    if(i < 0 || i > 1000)
    {
    ...
    }
    </pre>
      

  10.   

    你可以用DOM树来解析就可以啊!
      

  11.   


    首先你先创建一个接点(createElement)和属性,然后用get_style和put_cssText,
    再用IHTMLDOMNode中的appendChild函数就可以了啊!
      

  12.   

    用CString 的 方法实在太不优雅了.起码要用正则才对得起程序员的称号啊.楼主,你的Html是一个纯文件,还是ie上面的一个网页,还是其他内嵌Internet_Explorer Server的程序,或者最简单的只是你程序中用CHtmlView显示的html?
      

  13.   

    IHTMLElement::innerText
    怎么使用啊?还没入门呢,请教一下
      

  14.   

    你用DOM树解析, mshtml中找 IHTMLElement::innerText 这个应该就可以
      

  15.   

    IHTMLElement::innerText 
    IHTMLElement::innerText 
    IHTMLElement::innerText 
    IHTMLElement::innerText 
    IHTMLElement::innerText 
    IHTMLElement::innerText 
    IHTMLElement::innerText 
    就用这个