http://www.zootoo.com/petnews/canineheroesamemorialdaysalute-1612
http://www.zootoo.com/petnews/hailtothecatsasalutetofirstfel-1611
http://www.zootoo.com/petnews/mothersdaygiftsforthepetloving-1592
比如这三个网页
第一个是分页内容,不用管分页
需要把正文部分抓取出来,如何处理?
PHP不是很熟,高分求教,谢谢

解决方案 »

  1.   

    我看了下html源码,感觉正则不是很好弄,特别是内容的前面只是一个<div>,请高手指教如何处理
    另请附代码,谢谢
      

  2.   


    header("Content-type:text/html;charset=utf-8");
    $url="http://www.zootoo.com/petnews/hailtothecatsasalutetofirstfel-1611";  
    $contents=file_get_contents($url);
    $contents=preg_replace('/>(\s+)/','>',$contents);
    $contents=str_replace("\r\n",'',$contents);
    $contents=str_replace("\t",'',$contents);
    //echo $contents;
    preg_match_all('~<div class="f_right" style="width: 175px;">(.*?)</div>(.*?)</div><div class="sep_line1 e_push15"></div>~is',$contents,$p);
    print_r($p[1]);
    print_r($p[2]);