现在想到了几个问题 
1 日志同步收集的问题          准备用rsync 
2 日志文件分析集中处理的问题  单节点服务器打印的日志是自己服务器的时间,多台集中之后。需要对日志时间重新排序,这样日志文件很多很大,所有准备用开句柄的方式去处理,不可能把文件读入到内存中。多文件集中处理后生成单文件之后还有数据大小的限制。这个直接在写入之前做比较就行了。 
3 异常情况的考虑          这个是个难点。 
  1》如果莫节点服务器日志没同步过来,或者出故障。但是日志不可能不处理,如果故障节点恢复了。难道所有的日志又重新处理一次吗? 
  2》日志异常报警的问题 不仅仅是单节点日志会出问题,就是集中处理的时候也可能有异常。 
3 部署的问题 我一直比较愿意,把日志模块独立出来单独部署。因为我担心其他的模块异常导致我日志模块线程中断。另外其他程序的更新可能会对我的日志模块有影响。 
4 开发语言 可能还是准备用java。其实我觉得python或者perl可能开发效率高一点儿。 
应该还有很多问题,有人有时间,有经验多谢分享。