想获取一个页面中的部分内容,代码如下,运行结果为空,不知道为啥
$con= file_get_contents("http://www.meishij.net/zuofa/gouqiboluoyinertang_5.html");
$preg ='#<div class="edit">(.*)</div>#';
  
preg_match_all($preg, $con, $arr); //搜索内容赋值给数组print_r($arr);就是想截取<div class="edit"></div>之间的内容

解决方案 »

  1.   

    $preg=<div class=\"edit\">(.*?)<\/div>;
      

  2.   

    内容取回来后,$con都是空的。肯定没值啊
      

  3.   

    感觉这个做法不大对,<div class="edit">开始到最后一个</div>结束但不一定是对应的标签闭合关系
      

  4.   

    的确 $con 没结果,不知道为啥不能抓取这个页面的内容呢
      

  5.   

    $con= file_get_contents("http://www.meishij.net/zuofa/gouqiboluoyinertang_5.html");
    echo $con;
    哪位大神指导,为啥$con是空值
      

  6.   

    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, "http://www.meishij.net/zuofa/gouqiboluoyinertang_5.html");
    curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)");
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    $con=curl_exec($ch);
    curl_close($ch);
    echo $con;
      

  7.   

    楼上用的是报文头的方式可以返回正常的,可是为什么用file_get_contents()不可以啊!!
      

  8.   

    一样是可以的,由于他检查了是否是浏览器访问,所以要伪造一下$url = 'http://www.meishij.net/zuofa/gouqiboluoyinertang_5.html';
    $opts = array( 
      'http'=>array( 
        'user_agent' => "Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)",
      ) 
    ); 
    $context = stream_context_create($opts); 
    $con = file_get_contents("http://www.meishij.net/zuofa/gouqiboluoyinertang_5.html", false, $context);