求问：如何用纯PHP抓取谷歌搜索出来的描述（即该链接的description）？

就是用php抓取google搜索的下面一小段描述文字可以吗？

顶下吧。再问下另一个相关的：不知道该这么表达，就是说，能不能在本地网站搜索返回比如百度，google网站的结果？我在返回得到的值里查找。。

楼主是不是想要这样
<?php
ob_start('Content-type: text/html;charset=gb2312');
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://www.baidu.com/s?bs=%E9%98%BF%E4%BC%AF&ie=utf-8&f=8&rsv_bp=2&wd=%E5%85%B3%E4%BA%8ECSDN');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 GTB5');
$htmls = curl_exec($ch);$pattern ="#\" target=\"_blank\" >(.*?)... #is";
preg_match_all($pattern, $htmls, $arr);
$i=0;
while(@$arr[1][$i])
{
echo $arr[1][$i]." ";
$i++;
}
/*
关于CSDN收费问题 - 扩充话题 / 灌水乐园
自从263进行全面收费以来在CSDN就有人建议CSDN也实行收费不排除CSDN有这方面意图如果那天到来了话不能说收就收该不该收收多少请CSDN尊重我们意见就目前
关于CSDN, cnblog, iteye和51cto四个博客网站的比较与分析 - PkuC...
可以看出国内csdn>cnblog>51cto>iteye，而51cto在一些国际搜索引擎相对比较有影响力。 8.3 流量排名的统计以下是Alexa Internet, Inc.做的关于博客网站流量排名(
一个关于csdn密码大泄露的微小说
一个关于csdn密码大泄露的微小说#1 - 2011-12-22 11:43啊诺八嘎 (Time goes by) CSDN密码泄漏，她急忙下载下来，查看自己的密码是否在其中。在她搜索自己的
关于CSDN大暴库 chenxupro's blog
以防万一，我也下了库文件，看了下，暂时没有我的那俩号，还都是2008年上... 话说回来，CSDN这几年的确是越来越"讨厌"，从最开始的评星星返还分数，到
关于CSDN全国最大的软件开发者社区遭受黑客攻击600多万的用户账号...
2011年12月27日 - 关于CSDN网站用户帐号被泄露的声明： CSDN网站早期使用过明文密码，使用明文是因为和一个第三方chat程序整合验证带来的，后来的程序员始终未对此进行
关于【CSDN免积分下载器】的分析 - ty1921的学习历程 - 博客频道 ...
刚开始以为是CSDN爆出后门了啥的，免积分，那不是越权XX啥都有了，后来才看到这个帖子：http://topic.csdn.net/u/20111021/14/1fc7f1d7-2cd5-49e1-9750-530
关于【CSDN免积分下载器】的分析 - 最大的青鸟 - ITeye技术网站
刚开始以为是CSDN爆出后门了啥的，免积分，那不是越权XX啥都有了，后来才看到这个帖子：http://topic.csdn.net/u/20111021/14/1fc7f1d7-2cd5-49e1-9750-530
关于CSDN 数据库600万用户账号密码被盗以及各大网站数据库被拖 -...
2条回复 - 发帖时间: 2011年12月22日
今日有黑客在网上公开了CSDN网站用户数据库，包括600余万个明文的注册邮箱帐号和密码。CSDN是国内最大的程序员网站，请广大程序员务必重视并尽快修改密码，包括CSDN
关于csdn站内消息js代码的一些问题，请高手帮忙，顶者有分！！！...
下面是csdn的站内消息js代码，大家也可以点查看源代码进行查看，这些代码有些不明白的地方，请高手赐教…… ---------- <!DOCTYPE html
*/?>

去 http://simplehtmldom.sourceforge.net/ 下载一个simple_html_dom.php。然后用curl轻松搞定。require('simple_html_dom.php');
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://www.google.com/search?hl=zh-CN&q=ajax');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 GTB5');
$htmls = curl_exec($ch);
curl_close($ch);
$html = str_get_html($htmls);
foreach($html->find('div[id=search]') as $element){
 $fata = $element->find('.st');
 foreach ($fata as $link)
 echo $link->innertext.' ';
}

嗯。是这个意思。不过能不能不用百度的搜索结果，可以用bing的搜索吗？另外，这个
$pattern ="#\" target=\"_blank\" >(.*?)... #is";没怎么看懂，能解释下不？

你给个实际的查询连接，作为讨论和测试的基础bing 的说明文字使用js产生，处理起来比较复杂

OK。这个是英文状态下的bing搜索：
http://cn.bing.com/search?q=mcse&qs=n&pq=mcse&sc=8-4&sp=-1&sk=&intlF=1&upl=&qpvt=mcse获取它每个链接的一小段描述。

ob_start('Content-type: text/html;charset=utf-8');
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://www.bing.com/search?q=mcse&qs=n&pq=mcse&sc=8-4&sp=-1&sk=&intlF=1&upl=&qpvt=mcse&mkt=zh-CN');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 GTB5');
$htmls = curl_exec($ch);//$pattern ="#\" target=\"_blank\" >(.*?)... #is";
$pattern="^翻译此页</a></div>(.*?)^i";
preg_match_all($pattern, $htmls, $arr);
print_r($arr);
$i=0;
while(@$arr[1][$i])
{
 echo $arr[1][$i]." ";
 $i++;
 }
?>
我这样写是空白，不知道为什么！

require('simple_html_dom.php');
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://www.bing.com/search?q=mcse&qs=n&pq=mcse&sc=8-4&sp=-1&sk=&intlF=1&upl=&qpvt=mcse&mkt=zh-CN');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 GTB5');
$htmls = curl_exec($ch);
curl_close($ch);
$html = str_get_html($htmls);
foreach($html->find('#results') as $element){
 $fata = $element->find('.sa_mc');
 foreach ($fata as $link)
 echo $link->find('p',0)->innertext.' ';
}

如果要去掉标签的话，再加个 strip_tags($link->find('p',0)->innertext)

BING没试过。。看引擎情况有所不同$pattern是正则

你的代码好像不能用啊，我下了simple_html_dom.php文件。但是报错：Fatal error: Call to a member function find() on a non-object in F:\phpweb\www\test.php on line 10

你确信simple_html_dom.php和test.php放在一个目录下？
改成require(dirname(__FILE__) . '/simple_html_dom.php'); 试下。
我一直在用simple_html_dom，省去许多繁琐的正则公式，简单易用。

那就先不要simple_html_dom.php，echo $htmls，看看是什么结果？
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://www.bing.com/search?q=mcse&qs=n&pq=mcse&sc=8-4&sp=-1&sk=&intlF=1&upl=&qpvt=mcse&mkt=zh-CN');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 GTB5');
$htmls = curl_exec($ch);
curl_close($ch);
echo $htmls;

调试易

求问：如何用纯PHP抓取谷歌搜索出来的描述（即该链接的description）？

解决方案 »