curl解析某网站时,遇到一个BT的问题:某网站一段php代码由于没有使用完整的 <?php ?> 被当做html源码给解析出来了。如何用正则去掉这段php标签里的文字?谢谢。<div id="content">
    some words
</div>
<?
$box_social['dimensioni']="80";
        $box_vota=array();
$box_vota["novideo"]='';
$box_vota["nofoto"]='';
$box_vota["id_articolo"]='1003691';
include($_SERVER['DOCUMENT_ROOT']."/incs/box_social.php");
?>
<div id="footer">
   some words
</div>

解决方案 »

  1.   

    将 <?   ?> 中间的代码去掉?
      

  2.   

    将 <?   ?>部分整个去掉 '/<?(.+)?>/i' 好像不工作,是不是要加反斜杠还是怎么写着的?
      

  3.   

    preg_replace('/<\?.*?\?>/','',$html);
      

  4.   

    其实楼主是不是要把php的代码运行还是去掉?
    如果是<?的问题,直接把<?替换为<?php就行。
      

  5.   

    这么幸福 源码都能看见,要是我就提醒管理员 把他修正了 这样我也就不需要去管他什么 php代码了,也作为采集的回报。是吧?一举两得~