这样的
我打算采集一下腾讯的新闻练练手
写了一段代码,要采集的页面是  http://news.qq.com/a/20090822/000377.htm
代码如下$url=$ur[$q];//得到采集页面
   
   $fcontents=file_get_contents($url);  //得到页面内容
   //腾讯新闻有两种页面,一种是内容一气呵成的,另外一种是内容中插有推荐阅读信息的,就像上面给的连接
   $rgtemp=strpos($fcontents,'Reading');//Reading是推荐阅读部分特有的css类,有Reading,将文章分两部分截取
   if($rgtemp){
   eregi('id="ArticleCnt">(.*)<div id="Reading">',$fcontents,$temp1);//正则匹配,截取第一部分
   eregi('</table>
</div>(.*)/P></div>',$fcontents,$temp2);//正则匹配 截取第二部分
   //echo "$temp1[1]"."<br/>"."$temp2[1]";
   $rg[1]=$temp1[1].$temp2[1];//将第一部分和第二部分合在一起
   }else{
   eregi('id="ArticleCnt">(.*)/P></div>',$fcontents,$rg);
   }上面的代,在我本地运行没有问题,正好得到这正确的结果
但我把代码上传到我的 hostmonster空间以后,我第二部分结果无法得到,正常得到第一部分结果
这是我空间上的运行结果
http://www.163jie.com/_onseu/caiji.php
求助大侠 为什么?我正则写的有问题还是服务器配置有问题?我本地apache和HM空间上都是默认配置
你可以第一时间和我交流

解决方案 »

  1.   

    在PHP配置中有一个allow_url_fopen要是打开的状态才能正常的读 URL形式的文件,楼主的是吗?虽然一般上都是打开的。如果在本地测试是好的,而在服务器上是不正常的,估计能排除正则的问题了,而楼主的与此正则只是替换一下CSS,应该不会有问题的。
    我刚才点了楼主的那个链接,好像没有什么问题啊,怪
      

  2.   

    测试 ..-> 字符串数据: [http://news.qq.com]
    -> 字符串数据: [http://news.qq.com/china_index.shtml]
    -> 字符串数据: [http://news.qq.com/a/20090824/001378.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001375.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001379.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001271.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001263.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001260.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001280.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001252.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001234.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001242.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001238.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001376.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001226.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001269.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001235.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001217.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001265.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001220.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001268.htm]
    -> 字符串数据: [http://news.qq.com/a/20090824/001188.htm]
    新闻要闻----采集读取地址ok!now()布达拉宫等三大重点文物保护维修工程竣工_各地新闻_新闻_腾讯网
    8月23日上午,西藏布达拉宫、罗布林卡、萨迦寺三大重点文物保护维修工程竣工典礼在拉萨布达拉宫广场隆重举行。
    安徽黄山观瀑楼入选国庆直播点_各地新闻_新闻_腾讯网
    为祖国喝彩——全国大型电视直播活动,是今年国庆期间央视三大直播活动之一。30年前邓小平视察黄山的居住地——黄山观瀑楼,入选此次活动的直播点。此次直播活动,是由中宣部批准、中央电视台联合全国30多家省级电视台共同举办的一次长达12个小时的大型直播活动,整个直播活动将于10月3日由央视三套现场播出。黄山风景区的直播分为三个版块:5分钟的专题短片,全面介绍黄山优美的自然风光和厚重的文化品位;邀请文化名人解读黄山的文化内涵;邀请我省黄梅戏名家在观瀑楼前演唱,将黄山与黄梅相结合起来,共同展示安徽的风采。(程亚星)(来源:安徽日报)[责任编辑:pennyhuang]
    河北阜城液化气供应站火灾事故3名当事人被拘_各地新闻_新闻_腾讯网
    中新网衡水8月24日电 (记者崔志平)河北省衡水市公安消防支队今日透露,2009年8月20日19时39分,由于连接管道和槽车的橡胶软管在靠近槽车卸车口处的橡胶老化出现裂缝,造成液态液化气外泄而发生在河北省阜城县王集液化气供应站的“8·20”火灾事故,涉及的3名当事人已被行政拘留。
    上海金融国资国企改革启动 六企业明确方向_各地新闻_新闻_腾讯网
      上海金融国资国企改革一直备受市场关注。特别是国务院批准上海金融中心建设之后,如何建立起与上海未来地位相匹配的金融国资国企队伍不仅责任重大,而且意义深远。
    湖北近三百万亩农田受旱 6万人饮水困难_各地新闻_新闻_腾讯网
    中新社武汉八月二十四日电 (记者艾启平)湖北省防汛抗旱指挥部办公室二十四日公布,近期持续持晴热高温,致使湖北局部地方高温伏旱有所发展。截至二十三日,全省受旱农田面积增至近三百万亩,广水、松滋、大悟、兴山等四县市有五点九二万人饮水困难。
    沈阳规定提拔后备干部须在信访部门挂职锻炼_各地新闻_新闻_腾讯网
      43岁的王晓刚,一个多月前被任命为沈阳市公安局刑警支队支队长。他坦言,在沈阳信访大厅的挂职锻炼让他获益匪浅。据悉,近一年来,沈阳市有23名县处级以上干部到沈阳信访大厅挂职锻炼,培养了对群众的感情,提高了工作能力,不断形成好的作风。
    青海湖显现“海市蜃楼”影像(组图)_各地新闻_新闻_腾讯网
      

  3.   

    谢谢楼上的各位
    问题解决了,但不是各位解决方案
    问题出在我在本地得到的文件内容和在远程得到的内容不一样
    对于分段格式的不一样
    恰巧我在不一样的地方用了正则去截取
    现在采集已经结束,我换用了新浪的源
    大家有兴趣可以去我的站点看看
    在采集上的问题也可以交流交流
    http://seu.handxy.com
      

  4.   

    谢谢楼上的各位
    问题解决了,但不是各位解决方案
    问题出在我在本地得到的文件内容和在远程得到的内容不一样
    对于分段格式的不一样
    恰巧我在不一样的地方用了正则去截取
    现在采集已经结束,我换用了新浪的源
    大家有兴趣可以去我的站点看看
    在采集上的问题也可以交流交流
    http://seu.handxy.com