这个网址:http://www.c2000.cn/list.asp?boardid=111&page=2
想采集这个网站的内容,但他的内容都是通过客户端脚本生成的,怎么办,请哪位高手指点一下。

解决方案 »

  1.   

    xmlhttp,读取每个文章的列表就可以了,我有个类似的。
      

  2.   

    如果是正常的HTML页我可以采集,象天涯论坛,
    但现的网页内容是由客户端代码生成的,
    怎么采集啊,
      

  3.   

    举个简单的例子:
    <html><head>
    <meta http-equiv="Content-Type" content="text/html; charset=gb2312">
    <title>新建网页 1</title>
    <script language="javascript">
    function initBody()
    {
    var htmlstr="";
    for (var i=0;i<10;i++)
    {
    htmlstr=htmlstr+"<a href='showDetail.asp?Itemid="+i+"'>孤星传奇第"+i+"集</a><br>";
    }
    document.all("divLink").innerHTML=htmlstr;
    }
    </script>
    </head>
    <body onload="initBody()">
    <div id="divLink">ASDFASDFASF</div>
    </body></html>
    在界面上显示为:<a href='showDetail.asp?Itemid=0'>孤星传奇第0集</a>
    <a href='showDetail.asp?Itemid=1'>孤星传奇第1集</a>
    <a href='showDetail.asp?Itemid=2'>孤星传奇第2集</a>
    <a href='showDetail.asp?Itemid=3'>孤星传奇第3集</a>
    <a href='showDetail.asp?Itemid=4'>孤星传奇第4集</a>
    <a href='showDetail.asp?Itemid=5'>孤星传奇第5集</a>
    <a href='showDetail.asp?Itemid=6'>孤星传奇第6集</a>
    <a href='showDetail.asp?Itemid=7'>孤星传奇第7集</a>
    <a href='showDetail.asp?Itemid=8'>孤星传奇第8集</a>
    <a href='showDetail.asp?Itemid=9'>孤星传奇第9集</a>
    如何取得这个链接列表