部门的产品上线了,服务器开发也就告一段落。剩下大半年的时间就是服务器的维护。最近我们服务器组的3个人准备做一个服务器监控系统,监控为我们的产品提供服务和资源的5台服务器的运行情况。5台服务器都是Linux系统,一台运行apache,一台运行tomcat,一台运行数据库,一台提供资源下载,还有一台备用服务器。系统监控主要针对服务器的cpu、内存、硬盘、网络流量、端口、系统进程、apache、tomcat、数据库等进行监测,之前也没有做过类似的东西,所有很是郁闷,有很多的问题,比如:对于每个监测项如何进行监测,具体的监测方法是什么?系统进程,我就不知道该如何进程监测。其次,对于每项监测的报警临界点如何设置?比如网络流量如何监测?监测到什么数据的时候,说明服务器的带宽不够用了,要增加带宽了。apache如何监测,如何知道apache已经到了最大连接数,需要对系统进行集群和负载均衡了......最近几天都在网上找相关的资料,但是好像除了几个出售类似的服务器监测软件的公司之外,几乎没什么资料,希望有类似开发经验的同行们,给小弟一些建议和指导,在此谢过了

解决方案 »

  1.   

    如果只是内部使用,可以用开源的,比如bigsister,nagios,都是挺好的。而且一般这种监控都是写脚本实现就可以了,nagios就有很强的扩展能力,如果默认的监控不能满足,可以自己写脚本增加功能。
      

  2.   

    Jconsole你最好询问测试人员.
    压力测试,网络测试,它们最在行了
      

  3.   

    可能我没有说清楚,我们的监控是需要实时监控的,如果出现异常就需要发短信或者邮件报警,bigsister,nagios,我下来看看,谢谢
      

  4.   


    嗯,同意基本上这个已经属于“系统级”编程了,“应用级”编程的程序员很难做好“系统级”的程序
    (我认为JAVA程序员大多只是“应用级”的)