老大,你还能看到个日志呢,我们连日志都看不到,怎么帮你分析down掉的原因啊。
把你的日志贴出来

解决方案 »

  1.   

    是否检查过硬件设备?ALERT日志有报错吗?再看看操作系统的SYSLOG
      

  2.   

    呵呵,谢谢,想问一下操作系统的SYSLOG日志如何检查阿?
      

  3.   

    1,我们没看到alert日志,无从下手
       2,备机不装程序,那备机就起不到作用了
       3,看看操作系统日志
      

  4.   

    没有日子的DOWN机???停电?还是硬件出错??
      

  5.   

    Dec 21 14:39:37 ACCOUNT1 last message repeated 19 times
    Dec 21 14:39:57 ACCOUNT1 picld[1975]: [ID 528179 daemon.error] WARNING : HIGH TEMPERATURE DETECTED 102, CPU0_DIE_TEMPERATURE_SENSOR
    Dec 21 14:44:38 ACCOUNT1 last message repeated 14 times
    Dec 21 14:44:52 ACCOUNT1 genunix: [ID 408789 kern.warning] WARNING: ce2: fault detected external to device; service degraded
    Dec 21 14:44:52 ACCOUNT1 genunix: [ID 408789 kern.warning] WARNING: ce3: fault detected external to device; service degraded
    Dec 21 14:44:52 ACCOUNT1 genunix: [ID 451854 kern.warning] WARNING: ce2: xcvr addr:0x01 - link down
    Dec 21 14:44:52 ACCOUNT1 genunix: [ID 451854 kern.warning] WARNING: ce3: xcvr addr:0x01 - link down
    Dec 21 14:44:56 ACCOUNT1 cl_runtime: [ID 273354 kern.notice] NOTICE: CMM: Node ACCOUNT2 (nodeid = 2) is dead.
    Dec 21 14:44:58 ACCOUNT1 picld[1975]: [ID 528179 daemon.error] WARNING : HIGH TEMPERATURE DETECTED 102, CPU0_DIE_TEMPERATURE_SENSOR
    Dec 21 14:45:02 ACCOUNT1 cl_runtime: [ID 646950 kern.notice] NOTICE: clcomm: Path ACCOUNT1:ce3 - ACCOUNT2:ce3 being cleaned up
    Dec 21 14:45:02 ACCOUNT1 cl_runtime: [ID 646950 kern.notice] NOTICE: clcomm: Path ACCOUNT1:ce2 - ACCOUNT2:ce2 being cleaned up
    Dec 21 14:45:02 ACCOUNT1 cl_runtime: [ID 489438 kern.notice] NOTICE: clcomm: Path ACCOUNT1:ce3 - ACCOUNT2:ce3 being drained
    Dec 21 14:45:02 ACCOUNT1 cl_runtime: [ID 237149 kern.notice] NOTICE: clcomm: Path ACCOUNT1:ce3 - ACCOUNT2:ce3 being constructed
    Dec 21 14:45:02 ACCOUNT1 cl_runtime: [ID 489438 kern.notice] NOTICE: clcomm: Path ACCOUNT1:ce2 - ACCOUNT2:ce2 being drained
    Dec 21 14:45:02 ACCOUNT1 ip: [ID 898834 kern.notice] TCP_IOC_ABORT_CONN: local = 000.000.000.000:0, remote = 172.016.193.002:0, start = -2, end = 6
    Dec 21 14:45:02 ACCOUNT1 cl_runtime: [ID 237149 kern.notice] NOTICE: clcomm: Path ACCOUNT1:ce2 - ACCOUNT2:ce2 being constructed
    Dec 21 14:45:02 ACCOUNT1 ip: [ID 440816 kern.notice] TCP_IOC_ABORT_CONN: aborted 0 connection 
    Dec 21 14:45:02 ACCOUNT1 cl_runtime: [ID 446068 kern.notice] NOTICE: CMM: Node ACCOUNT2 (nodeid = 2) is down.
    Dec 21 14:45:02 ACCOUNT1 cl_runtime: [ID 108990 kern.notice] NOTICE: CMM: Cluster members: ACCOUNT1.
    Dec 21 14:45:02 ACCOUNT1 Cluster.Framework: [ID 801593 daemon.notice] stdout: resetting scsi buses shared with non-cluster nodes
    Dec 21 14:45:02 ACCOUNT1 Cluster.Framework: [ID 801593 daemon.notice] stdout: fencing node ACCOUNT2 from shared devices
    Dec 21 14:45:02 ACCOUNT1 Cluster.RGM.rgmd: [ID 446068 daemon.notice] CMM: Node ACCOUNT2 (nodeid = 2) is down.
    Dec 21 14:45:02 ACCOUNT1 cl_runtime: [ID 279084 kern.notice] NOTICE: CMM: node reconfiguration #9 completed.
    Dec 21 14:45:02 ACCOUNT1 Cluster.CCR: [ID 651093 daemon.warning] reservation message(fence_node) - Fencing node 2 from disk /dev/did/rdsk/d5s2