如:一个新闻的标题是:朝核问题第五轮六方会谈在北京开幕
主体内容是:中新网11月9日电 今天上午十时,朝核问题第五轮六方会谈的开幕式在北京钓鱼台国宾馆的芳菲苑举行。   据报道,开幕式之后,六方代表团将在中国外交部副部长武大伟的主持下召开全体会议,讨论本轮会谈的进行方案。我只要这个网页的主体内容。有没有办法实现?谢谢。

解决方案 »

  1.   

    用xmlhttp获取此页面的内容后根据页面的规律用正则表达式 提取
      

  2.   

    转贴:)用正则表达式写的HTML分离函数
    存成.asp文件,执行,你用ASPHTTP抓内容的时候用这个很爽,当然自己要改进一下了 <%
    Option ExplicitFunction stripHTML(strHTML)
    'Strips the HTML tags from strHTMLDim objRegExp, strOutput
    Set objRegExp = New RegexpobjRegExp.IgnoreCase = True
    objRegExp.Global = True
    objRegExp.Pattern = "<.+?>"'Replace all HTML tag matches with the empty string
    strOutput = objRegExp.Replace(strHTML, "")'Replace all < and > with < and >
    strOutput = Replace(strOutput, "<", "<")
    strOutput = Replace(strOutput, ">", ">")stripHTML = strOutput 'Return the value of strOutputSet objRegExp = Nothing
    End Function
    %><form method="post" id=form1 name=form1>
    <b>Enter an HTML String:</b><br>
    <textarea name="txtHTML" cols="50" rows="8" wrap="virtual"><%=Request("txtHTML")%></textarea>
    <p>
    <input type="submit" value="Strip HTML Tags!" id=submit1 name=submit1>
    </form><% if Len(Request("txtHTML")) > 0 then %>
    <p><hr><p>
    <b><u>View of string <i>with no</i> HTML stripping:</u></b><br>
    <xmp>
    <%=Request("txtHTML")%>
    </xmp><p>
    <b><u>View of string <i>with</i> HTML stripping:</u></b><br>
    <pre>
    <%=StripHTML(Request("txtHTML"))%>
    </pre>
    <% End If %>
      

  3.   

    测试了一下!对于复杂的页面表现不是很好,如果页面通过javascript显示标题内容不知道有效果没有,如果是框架呢?
      

  4.   

    这个正则表达式什么意思?
    <(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>