本帖最后由 s51384 于 2012-10-10 15:02:56 编辑

解决方案 »

  1.   

    就是用php抓取google搜索的下面一小段描述文字可以吗?
      

  2.   

    顶下吧。再问下另一个相关的:不知道该这么表达,就是说,能不能在本地网站搜索返回比如百度,google网站的结果?我在返回得到的值里查找。。
      

  3.   

    楼主是不是想要这样
    <?php
    ob_start('Content-type: text/html;charset=gb2312');
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, 'http://www.baidu.com/s?bs=%E9%98%BF%E4%BC%AF&ie=utf-8&f=8&rsv_bp=2&wd=%E5%85%B3%E4%BA%8ECSDN');
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 GTB5');
    $htmls = curl_exec($ch);$pattern ="#\"   target=\"_blank\" >(.*?)...<br>#is";
    preg_match_all($pattern, $htmls, $arr);
    $i=0;
    while(@$arr[1][$i])
    {
    echo $arr[1][$i]."<br/>";
    $i++;
    }
    /*
    关于CSDN收费问题 - 扩充话题 / 灌水乐园
    自从263进行全面收费以来 在CSDN就有人建议CSDN也实行收费 不排除CSDN有这方面 意图 如果那天到来了话 不能说收就收 该不该收 收多少请CSDN尊重我们 意见 就目前
    关于CSDN, cnblog, iteye和51cto四个博客网站的比较与分析 - PkuC...
    可以看出国内csdn>cnblog>51cto>iteye,而51cto在一些国际搜索引擎相对比较有影响力。 8.3 流量排名的统计 以下是Alexa Internet, Inc.做的关于博客网站流量排名(
    一个关于csdn密码大泄露的微小说
    一个关于csdn密码大泄露的微小说#1 - 2011-12-22 11:43啊诺八嘎 (Time goes by) CSDN密码泄漏,她急忙下载下来,查看自己的密码是否在其中。在她搜索自己的
    关于CSDN大暴库 chenxupro's blog
    以防万一,我也下了库文件,看了下,暂时没有我的那俩号,还都是2008年上... 话说回来,CSDN这几年的确是越来越"讨厌",从最开始的评星星返还分数,到
    关于CSDN全国最大的软件开发者社区遭受黑客攻击600多万的用户账号...
    2011年12月27日 - 关于CSDN网站用户帐号被泄露的声明: CSDN网站早期使用过明文密码,使用明文是因为和一个第三方chat程序整合验证带来的,后来的程序员始终未对此进行
    关于【CSDN免积分下载器】的分析 - ty1921的学习历程 - 博客频道 ...
    刚开始以为是CSDN爆出后门了啥的,免积分,那不是越权XX啥都有了,后来才看到这个帖子:http://topic.csdn.net/u/20111021/14/1fc7f1d7-2cd5-49e1-9750-530
    关于【CSDN免积分下载器】的分析 - 最大的青鸟 - ITeye技术网站
    刚开始以为是CSDN爆出后门了啥的,免积分,那不是越权XX啥都有了,后来才看到这个帖子:http://topic.csdn.net/u/20111021/14/1fc7f1d7-2cd5-49e1-9750-530
    关于CSDN 数据库600万用户账号密码被盗 以及各大网站数据库被拖 -...
    2条回复 - 发帖时间: 2011年12月22日
    今日有黑客在网上公开了CSDN网站用户数据库,包括600余万个明文的注册邮箱帐号和密码。CSDN是国内最大的程序员网站,请广大程序员务必重视并尽快修改密码,包括CSDN
    关于csdn站内消息js代码的一些问题,请高手帮忙,顶者有分!!!...
    下面是csdn的站内消息js代码,大家也可以点查看源代码进行查看,这些代码有些不明白的地方,请高手赐教…… ---------- <!DOCTYPE   html   
    */?>
      

  4.   

    去 http://simplehtmldom.sourceforge.net/ 下载一个simple_html_dom.php。然后用curl轻松搞定。require('simple_html_dom.php');
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, 'http://www.google.com/search?hl=zh-CN&q=ajax');
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 GTB5');
    $htmls = curl_exec($ch);
    curl_close($ch);
    $html = str_get_html($htmls);
    foreach($html->find('div[id=search]') as $element){ 
           $fata = $element->find('.st');
           foreach ($fata as $link) 
           echo $link->innertext.'<br />';
    }
      

  5.   

    嗯。是这个意思。不过能不能不用百度的搜索结果,可以用bing的搜索吗?另外,这个
    $pattern ="#\"   target=\"_blank\" >(.*?)...<br>#is";没怎么看懂,能解释下不?
      

  6.   

    你给个实际的查询连接,作为讨论和测试的基础bing 的说明文字使用js产生,处理起来比较复杂
      

  7.   


    OK。这个是英文状态下的bing搜索:
    http://cn.bing.com/search?q=mcse&qs=n&pq=mcse&sc=8-4&sp=-1&sk=&intlF=1&upl=&qpvt=mcse获取它每个链接的一小段描述。
      

  8.   


    ob_start('Content-type: text/html;charset=utf-8');
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, 'http://www.bing.com/search?q=mcse&qs=n&pq=mcse&sc=8-4&sp=-1&sk=&intlF=1&upl=&qpvt=mcse&mkt=zh-CN');
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 GTB5');
    $htmls = curl_exec($ch);//$pattern ="#\"   target=\"_blank\" >(.*?)...<br>#is";
    $pattern="^翻译此页</a></div><p>(.*?)</p>^i";
    preg_match_all($pattern, $htmls, $arr);
    print_r($arr);
    $i=0;
    while(@$arr[1][$i])
    {
        echo $arr[1][$i]."<br/>";
        $i++;
        }
    ?>
    我这样写是空白,不知道为什么!
      

  9.   

    require('simple_html_dom.php');
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, 'http://www.bing.com/search?q=mcse&qs=n&pq=mcse&sc=8-4&sp=-1&sk=&intlF=1&upl=&qpvt=mcse&mkt=zh-CN');
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 GTB5');
    $htmls = curl_exec($ch);
    curl_close($ch);
    $html = str_get_html($htmls);
    foreach($html->find('#results') as $element){ 
           $fata = $element->find('.sa_mc');
           foreach ($fata as $link) 
           echo $link->find('p',0)->innertext.'<br />';
    }
      

  10.   

    如果要去掉<strong/>标签的话,再加个 strip_tags($link->find('p',0)->innertext)
      

  11.   

    BING没试过。。看引擎情况有所不同$pattern是正则
      

  12.   

    你的代码好像不能用啊,我下了simple_html_dom.php文件。但是报错:Fatal error: Call to a member function find() on a non-object in F:\phpweb\www\test.php on line 10
      

  13.   

    你确信simple_html_dom.php和test.php放在一个目录下?
    改成require(dirname(__FILE__) . '/simple_html_dom.php'); 试下。
    我一直在用simple_html_dom,省去许多繁琐的正则公式,简单易用。
      

  14.   

    那就先不要simple_html_dom.php,echo $htmls,看看是什么结果?
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, 'http://www.bing.com/search?q=mcse&qs=n&pq=mcse&sc=8-4&sp=-1&sk=&intlF=1&upl=&qpvt=mcse&mkt=zh-CN');
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 GTB5');
    $htmls = curl_exec($ch);
    curl_close($ch);
    echo $htmls;