php 正则分析google和baidu的结果页google
baidu
只提取中间的正文部分,保留关键字标红,其余的全部不要天呢,,受不了了大虾帮帮忙

解决方案 »

  1.   

    关键字标红又不是用html代码,用的是js还有你的要求都没讲得很清楚。最好是举个例子说明你要的内容
      

  2.   

    有没有想找PHP程序的工作,请尽快联系我QQ:51722854
      

  3.   


    http://www.baidu.com/s?ie=gb2312&bs=%B5%E7%CA%D3%BE%E7&sr=&z=&cl=3&f=8&wd=%CE%C2%D5%D7%C2%D7%D1%DD%B9%FD%B5%C4%B5%E7%CA%D3%BE%E7&ct=0这个连接中间的正文部分就是搜索引擎抓回的结果,下面是想要返回的结果<table cellpadding="0" cellspacing="0" id="1"><tr><td class="f"><a onclick="c({'fm':'alvd','title':this.innerHTML,'url':this.href,'p1':al_c(this)});"  target="_blank" href="http://video.baidu.com/v?ct=301989888&rn=20&pn=0&db=0&s=8&word=%CE%C2%D5%D7%C2%D7%20%B5%E7%CA%D3" ><font size="3"><font color="#c60a00">温兆伦演过的电视剧</font>—百度视频</font></a><br/><font size="-1"><font color="#c60a00">温兆伦</font>的全部电视:《李时珍》-《大旗英雄传》-《千金情缘》-《夺命真夫》-《牛郎织女》-《流金岁月》-《天下有情之阿福传》-《第三类法庭》-《武...<br/><font color="#008000">video.baidu.com/v?word=温兆伦+电视 2009-4-29</font><br/></font></td></tr></table><table>这里是其他的结果</table>
      

  4.   

    简单的写两,细节部分自己去弄吧,呵呵.$strContent = file_get_contents("http://www.baidu.com/s?wd=%B5%E7%CA%D3%BE%E7");
    preg_match_all("/<table (?:border=\"0\" )?cellpadding=\"0\" cellspacing=\"0\" id=\"[\d]+\">(.*?)<\/table>/im", $strContent, $matches);
    var_dump($matches);
    */
    $strContent = file_get_contents("http://www.google.cn/search?hl=zh-CN&q=%E7%94%B5%E8%A7%86%E5%89%A7&meta=&aq=f&oq=");
    preg_match_all("/<li class=g>(.*?)<\/div>/im", $strContent, $matches);
    var_dump($matches);