今天做爬虫,要爬取一个网站的商家信息
但是网站的商家地址做了跳转
例如
http://shop.yijia.com/gosite/goshop_3576_1/
对应的是
http://shop.imeelee.com/http://shop.yijia.com/gosite/goshop_4388_1/
对应的是
http://www.tx29.com/这个怎么在php程序中根据上面能爬取道德 连接 得到真实的网址
自己分析了好久 好像不行
。
在线等大牛
但是网站的商家地址做了跳转
例如
http://shop.yijia.com/gosite/goshop_3576_1/
对应的是
http://shop.imeelee.com/http://shop.yijia.com/gosite/goshop_4388_1/
对应的是
http://www.tx29.com/这个怎么在php程序中根据上面能爬取道德 连接 得到真实的网址
自己分析了好久 好像不行
。
在线等大牛
http://shop.yijia.com/gosite/goshop_4388_1/
对应的是
http://www.tx29.com/哪个地址才是你要的?我用浏览器打开也是 http://www.tx29.com/ 你要的是 http://www.tx29.com/?
$header = array("Referer:http://www.tx29.com/");
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_TIMEOUT, 30);
curl_setopt($ch, CURLOPT_HTTPHEADER,$header);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION,1);
ob_start();
curl_exec($ch);
ob_end_clean();
$x = curl_getinfo($ch);
curl_close($ch);
return $x;
}$ghurl='http://shop.yijia.com/gosite/goshop_3576_1/';
$contents = getContents($ghurl);
print_R( $contents['url']);这个是获取正常的.但是你的另外一个地址不清楚怎么是跳转到 http://www.tx29.com/mobile/懒得跟数据了.自己看数据分析分析吧