请教一下把一个网页的某部分内容抓取出来是怎么实现的...没有思路....
比如说我想抓取mmcfood.1x.net里面的表格...其他的都不要..

解决方案 »

  1.   

    curl 取得所有代码
    然后正则 或者解析dom 取需要的部分数据
      

  2.   

    curl抓取的是整个网页,用正则得到自己想要的东西。
      

  3.   

    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, 'http://mmcfood.1x.net/');
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 GTB5');
    $htmls = curl_exec($ch);
    curl_close($ch);
    preg_match("#<table width=\"1079\" ([^>]*)>(.*?)</table>#is", $htmls, $matches);
    echo $matches[0];
      

  4.   

    只是简单的抓取,
    直接用file获取网页,
    然后正则就ok了,
    用curl反而麻烦