最近在做团购聚合的网站,就是从各团购网站进行数据采集。遇到一网站,叫“爱爱团”(本贴绝不是广告贴,纯技术求助)http://www.aiaituan.com/这个网站的数据其他信息都能采集,就购买人数(就是网页上“***人已购买”)一项不知道如何采集。查看该网站源文件,找不到该数据的信息。请教高手,如何采集到这个数据?或者帮指明一下该数据从哪儿取。如果有人能知道该功能是如何实现的,那就更加感谢了。

解决方案 »

  1.   

    curl例子
    set_time_limit(0);
    //设置程序执行时间无限制
    $i=10000;
    //耍10000次
    for($j=0;$j<$i;$j++)
    {$URL="http://www.yoururl.com/bbs/savepost.asp";
    //这个地址是回复表单里面action的url地址
    $ch = curl_init();curl_setopt($ch,CURLOPT_URL,$URL);curl_setopt($ch,CURLOPT_REFERER,"http://www.hxfoods.com/bbs/dispbbs.asp?boardid=14&replyid=672709&id=127437&page=1&skin=0&Star=53");
    //设置来源地址,如果不设置,论坛服务器有可能有验证不允许回复
    curl_setopt($ch,CURLOPT_COOKIESESSION,true);
    //能保存cookie
    curl_setopt($ch,CURLOPT_COOKIE,"DvForum=userid=24122&usercookies=0&userhidden=2&password=w0reu3g775VrY745&userclass=%96%7C&username=%A1%FA%A1%FA%B8%D2%CB%C0%B6%D3%A1%FA&StatUserID=2194783945 ");
    //这儿就是设置cookie了
    curl_setopt($ch,CURLOPT_POST,1);
    curl_setopt($ch,CURLOPT_NOBODY,1);
    //不显示内容,因为有很多论坛回复后要自动跳转。
    curl_setopt($ch,CURLOPT_POSTFIELDS,'Body=gfdfgdfgasdfgdfgdfgdfg& followup=672709&RootID=127437&star=58&TotalUseTable=Dv_bbs3& amp;UserName=→→敢死队→&signflag=1&total=65535');
    //把你分析的回复表单的参数分别赋值
    curl_setopt ($ch, CURLOPT_HEADER,true);
    curl_exec($ch);
    if (curl_errno($ch))
    {
    print curl_error($ch);
    }
    else
    {
    curl_close($ch);
    }}
      

  2.   


    $.ajax({
    url: "services/index.php",
    data:query,
    cache:false,
    dataType:"json",
    success:function(data)
    {
    if(IS_AJAS_GOODS)
    {
    if(data.goods.btnHTML != "")
    $("#deal-price").html(data.goods.btnHTML);

    if(data.goods.statusHTML != "")
    $("#deal-status").html(data.goods.statusHTML);
    $("#deal-status").html(data.goods.statusHTML);
      

  3.   

    应该是ajax请求了吧?试着用抓包工具找一下
      

  4.   

    http://www.aiaituan.com/services/index.php?_=1280248893359&act=getStatus&m=Index&a=index&status=1&city=1&goodsID=158&buyUrl=%2Findex.php%3Fm%3DCart%26a%3Dindex%26id%3D158&messageUrl=%2Findex.php%3Fm%3DMessage%26a%3Dindex%26&orderCheckUrl=%2Findex.php%3Fm%3DOrder%26a%3Dcheck%26id%3D000&groupBondUrl=%2Findex.php%3Fm%3DUcGroupBond%26a%3Dprintbond%26id%3D000 我抓了下包,这个接口里返回的。你可以模拟浏览器去抓这个接口。