网址:http://yahoo.searchina.ne.jp/exchange/使用file_get_contents、模拟http访问、fopen之后在获取都无法获取到内容。实际测试到默认访问的是index.cgi模拟HTTP访问:
$url="yahoo.searchina.ne.jp";
$path='/exchange/';
$protocal='HTTP/1.1';
$method='GET';
$file = fsockopen("yahoo.searchina.ne.jp", 80, $errno, $errstr, 30);
if (!$file) {
echo "$errstr ($errno)<br />\n";
} else {
$header=$method." ".$path." ".$protocal."\r\n";
$header.="Accept: */*\r\n";
$header.="Accept-Language: zh-cn\r\n";
$header.="Accept-Encoding: gzip, deflate\r\n";
$header.="Host: yahoo.searchina.ne.jp\r\n";
$header.="Connection: Keep-Alive\r\n";
fwrite($file, $header);
while(!feof($file)) {
echo $file."<br>";
$feedBack.=fgets($file);
}
fclose($file);
}
echo $feedBack;
下面是httpwatch记录的访问信息:
GET /exchange/ HTTP/1.1
Accept: */*
Accept-Language: zh-cn
Accept-Encoding: gzip, deflate
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)
Host: yahoo.searchina.ne.jp
Connection: Keep-Alive