$url="http://s.click.taobao.com/t_8?e=7HZ6jHSTbIWZXoQ43%2BGOC2vGvlT28S6knArdy2HkZM%2BsVw%3D%3D&p=mm_32165125_0_0";
采集后不能获取跳转后的页面
高手们,该怎么设置参数才能够获取到跳转后的url?

解决方案 »

  1.   

    curl_setopt($ch, CURLOPT_FOLLOWLOCATION,true)
      

  2.   

    [code=PHP][$url ="http://s.click.taobao.com/t_8?e=7HZ6jHSTbIWZXoQ43%2BGOC2vGvlT28S6knArdy2HkZM%2BsVw%3D%3D&p=mm_32165125_0_0";
    $r_url = _curl_post_302($url, "");
    var_dump($r_url);
    function _curl_post_302($url, $vars) {
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_POST, 1);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); // 302 redirect
    curl_setopt($ch, CURLOPT_POSTFIELDS, $vars);
    $data = curl_exec($ch);
    $Headers = curl_getinfo($ch);
    curl_close($ch);
    if ($data&&$Headers)
    return $Headers["url"];
    else
    return false;
    }
    function _curl_post($url, $vars) {
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_POST, 1);
    curl_setopt($ch, CURLOPT_POSTFIELDS, $vars);
    $data = curl_exec($ch);
    curl_close($ch);
    if ($data)
    return $data;
    else
    return false;
    }/code]
    结果:"http://www.taobao.com/home/error.php"
      

  3.   

    你想采集宝贝的详情吗
    跳转后拼接成
    http://item.taobao.com/item.htm?id=15711538808
    取得宝贝描述的链接(没记错的话宝贝链接是另外再callback的)
    再次读取
      

  4.   

    我只想采集这个地址http://item.taobao.com/item.htm?id=15711538808
    该怎么采集到这个,麻烦写的详细些
      

  5.   

    我得到的url:"http://www.taobao.com/home/error.php",哪里有问题
      

  6.   

    那么 http://www.taobao.com/home/error.php 是什么呢?
    很抱歉,您查看的宝贝不存在,可能已下架或者被转移就是说你给的 url 参数不正确
      

  7.   

    这个地址是有的跳转后的url=http://item.taobao.com/item.htm?id=15711538808&ali_trackid=2:mm_32165125_0_0:1346999816_310_551572511
    我怎么获取到
      

  8.   

    A.代码加上 cookie(我不确定要还是不要,我测试的时候写了)
    B.代码加上 我上面要求的 curl_setopt($ch, CURLOPT_FOLLOWLOCATION,true)
    C.抓取结果内的 以下范例地址
    http://dsc.taobaocdn.com/i2/150/110/15711538808/T1xk6KXatfXXcWeqbX.desc%7Cvar%5Edesc%3Bsign%5Ee25bc908cafba19c219353a66bcce7b4%3Blang%5Egbk%3Bt%5E1346995853
    D.爬上面的地址 取得宝贝描述内容
    E.输出多年前就写过这些东西了,淘宝还是没啥变化.代码先自己写吧...我只是分析到了 C部分.不过剩下的已经不是什么问题了。
      

  9.   

    curl 里有个获取302网页的设置的