本帖最后由 lihuan2008a 于 2010-05-17 16:58:13 编辑

解决方案 »

  1.   

    下面的代码,你保存为:1.htm,运行一下<SCRIPT language=javascript>
    <!--
    function init(){
    var str=document.getElementById("contents").innerHTML;
    alert(str)
    }
    //-->
    </SCRIPT>
    <body onload="init();">
    </body>
    <div id="contents" class="contenttext">
    正文内容也是N长
    正文内容也是N长
    正文内容也是N长
    正文内容也是N长
    正文内容也是N长
    正文内容也是N长</div>
      

  2.   

    这和标记有关系吗?
    document.getElementById("contents").innerHTML
    取的是对应id的对象,你去试一下不就知道能不能用了
      

  3.   


    <SCRIPT language=javascript>
    <!--
    /*
    ** flag 标签
    */
    function init(flag){
    var aArray = document.getElementsByTagName(flag);
    for(var i=0;i <aArray.length;i++){
       alert(aArray.item(i).innerHTML);
    }
    }
    //-->
    </SCRIPT>
    <body onload="init('div');">
    </body>
    <div id="contents" class="contenttext">
    正文内容也是N长
    正文内容也是N长
    正文内容也是N长
    正文内容也是N长
    正文内容也是N长
    正文内容也是N长</div>
      

  4.   


    使用 document.getElementsByTagName(标签名称) 就行了
      

  5.   


    如果 1楼兄台的 回复对lz没有帮助,我想 lz 你是不是应该反省下自己,  是不是在这表达的不够清楚,
    顶1楼
      

  6.   

    爬虫应该写在后台,使用正则表达式轻松解决:private String getContent(String start, String end) {
        //这段代码是核心
        String regex= "^.*$"; 
        //抓取页面内容方法记不太清了
        String html = Response.getContext()...;
        // 使用正则取出对就标记内容
        Pattern pattern = Pattern.compile(regex, Pattern.CASE_INSENSITIVE);
        Matcher matcher = pattern.matcher(html);
        if (matcher.find()) {
            return matcher.group(1);
        }else{
            return "";
        }}希望对你有所帮助
      

  7.   

    上面的正则加颜色搞错了,正则应该是:
    String regex= "^" + start + ".*" + end + "$";
      

  8.   


    使用 document.getElementsByTagName(标签名称) 就行了