我自己写了套小的CMS,现在想实现的功能是新闻自动采集入库,完全不需要人工干预。我有几个设想,不知道哪个是可行的,或者有更好的解决方案:1、通过火车头等采集器写好采集规则,和程序建立接口,我在本地采集,远程发布(但是不需要知道管理员账号密码);2、采集程序绑定CMS,设置定时采集,但是怎么能保证这个程序到时间自动运行呢 ?暂时我就这两个想法,请问大家这两个方案哪个更加可行,如果可行,具体怎么实现呢?或者是有什么更好的解决方案?

解决方案 »

  1.   

    PHP还做不到完全自动采集吧。你写的cms可以公开下载的?
      

  2.   

    保证有一个页面一直运行然后  用 用 js 的 setInterval( "function", time ) +  ajax 实现 ...
      

  3.   

    1.使用已有产品火车头等采集
    2.完全不需要人工干预是不可能的
    3.自己开发吧,这样虽然工作量大,但适合自己的需求,用CURL
      

  4.   

    1、通过火车头等采集器写好采集规则,和程序建立接口,我在本地采集,远程发布(但是不需要知道管理员账号密码); 
    这个肯定是不行的,因为别人没有给你源代码,你当然不会知道怎么加账号和密码了。2、采集程序绑定CMS,设置定时采集,但是怎么能保证这个程序到时间自动运行呢 ? 
    这个你需要记录最后采集的内容ID号(如果有),如果没有就要采取其它方法了。自己看看吧!
      

  5.   

    用火车头怎么不可以?火车头有个web发布模块,你自己可以开发一个,
    发布的时候只要远程调用发布地址就行了,怎么会需要远程账户和密码呢?
      

  6.   


    直接用PHP写个HTTP客户端程序,crontab控制启动时间。