浏览器直接访问 http://www.google.com.hk/search?q=site:www.qqook.com  得到的是简体中文 收录10,100file_get_contents (抛弃掉,一半都是失败)用 Snoopy (得到的是 英文界面的google 收录9,680)用 Curl (得到的是 繁体中文界面的google 收录9,370)我想要的是跟浏览器直接访问得到的结果一样  也就是简体中文google  怎么做?我也尝试设置 header 、agent、referer 、cookie 都不行!
求高人指点!~

解决方案 »

  1.   


    http://topic.csdn.net/u/20110316/17/f26795a3-d953-4b3b-9b21-0eca0d08db89.html
      

  2.   


    不能算你答对了!因为你这个是点击了 搜索之后的结果http://www.google.com.hk/search?hl=zh-CN&newwindow=1&safe=strict&q=site%3Awww.qqook.com&btnG=Google+%E6%90%9C%E7%B4%A2&aq=f&aqi=&aql=&oq=虽然结果是正确的 ,但是我想问的是require_once('Snoopy.class.php');
    $snoopy = new Snoopy(); 
    $snoopy->fetch('http://www.google.com.hk/search?q=site:www.qqook.com');
    echo $snoopy->results; 直接对这个地址进行请求http://www.google.com.hk/search?q=site:www.qqook.com这个地址在浏览器里访问 和抓取的结果不一样
      

  3.   

    "http://www.google.com.hk/search?hl=zh-CN&q=site:www.qqook.com"你刷新多几次就知道 这结果有变化
      

  4.   


    google用了cookie再跳转的方法。所以你无论用snoopy还是curl 得分两步
    第一步连接google获得cookie并存储,curl可以直接存储成文件形式,snoopy可以存成SESSION,第二步 连带这个cookie去检索google, 并获取返回文件。这样就能获得正确的中文简体的搜索结果。
      

  5.   

    google不但检测cookie还检测agent