RAC中,为什么使用 crs_stat -t 看到的状态 不断变化?VMware模拟10g RAC,2个节点,启动后,把crs_stat -t中看到的,都调整成ONLINE,结果如下:[root@node2 ~]# /opt/ora10g/product/10.2.0/crs_1/bin/crs_stat -t
Name           Type           Target    State     Host
------------------------------------------------------------
ora....B1.inst application    ONLINE    ONLINE    node1
ora....B2.inst application    ONLINE    ONLINE    node2
ora.RACDB.db   application    ONLINE    ONLINE    node2
ora....SM1.asm application    ONLINE    ONLINE    node1
ora....E1.lsnr application    ONLINE    ONLINE    node1
ora.node1.gsd  application    ONLINE    ONLINE    node1
ora.node1.ons  application    ONLINE    ONLINE    node1
ora.node1.vip  application    ONLINE    ONLINE    node1
ora....SM2.asm application    ONLINE    ONLINE    node2
ora....E2.lsnr application    ONLINE    ONLINE    node2
ora.node2.gsd  application    ONLINE    ONLINE    node2
ora.node2.ons  application    ONLINE    ONLINE    node2
ora.node2.vip  application    ONLINE    ONLINE    node2过了几秒钟,再次查看,看到的 就变化了,如下:[root@node2 ~]# /opt/ora10g/product/10.2.0/crs_1/bin/crs_stat -t
Name           Type           Target    State     Host
------------------------------------------------------------
ora....B1.inst application    ONLINE    ONLINE    node1
ora....B2.inst application    ONLINE    ONLINE    node2
ora.RACDB.db   application    ONLINE    ONLINE    node2
ora....SM1.asm application    ONLINE    ONLINE    node1
ora....E1.lsnr application    ONLINE    ONLINE    node1
ora.node1.gsd  application    ONLINE    ONLINE    node1
ora.node1.ons  application    ONLINE    ONLINE    node1
ora.node1.vip  application    ONLINE    ONLINE    node1
ora....SM2.asm application    ONLINE    ONLINE    node2
ora....E2.lsnr application    ONLINE    OFFLINE
ora.node2.gsd  application    ONLINE    ONLINE    node2
ora.node2.ons  application    ONLINE    ONLINE    node2
ora.node2.vip  application    ONLINE    OFFLINE过了几秒钟,再次查看,看到的 又变化了,如下:[root@node2 ~]# /opt/ora10g/product/10.2.0/crs_1/bin/crs_stat -t
Name           Type           Target    State     Host
------------------------------------------------------------
ora....B1.inst application    ONLINE    ONLINE    node1
ora....B2.inst application    ONLINE    OFFLINE
ora.RACDB.db   application    ONLINE    ONLINE    node2
ora....SM1.asm application    ONLINE    ONLINE    node1
ora....E1.lsnr application    ONLINE    ONLINE    node1
ora.node1.gsd  application    ONLINE    ONLINE    node1
ora.node1.ons  application    ONLINE    ONLINE    node1
ora.node1.vip  application    ONLINE    ONLINE    node1
ora....SM2.asm application    ONLINE    OFFLINE
ora....E2.lsnr application    ONLINE    OFFLINE
ora.node2.gsd  application    ONLINE    ONLINE    node2
ora.node2.ons  application    ONLINE    ONLINE    node2
ora.node2.vip  application    ONLINE    ONLINE    node2
最后的情况是:node1上的状态 都 正常ONLINE,node2上的 asm、listener、inst都是OFFLINE。我想问的是:
1,为什么使用 crs_stat -t 看到的状态 不断变化?
2,为什么最后的状态是   “node1上的状态 都 正常ONLINE,node2上的 asm、listener、inst都是OFFLINE”?这说明了什么?怎么解决呢?
非常谢谢大家啊。

解决方案 »

  1.   

    正常情况下,这些进程都应该是online的。 offline 就代表出现了问题。 RAC 节点之前敏感的东西很多。 比如网络不稳定,或者时间不同步,都可能造成相关进程的异常或者重启。 或者导致OS 系统直接重启。 ASM 异常,inst 是肯定起不来的。 因为inst 是跑的asm 实例上的。 asm 实例正常后,inst 才能启动。 你可以手动的重新启动一下这些进程看看。 crs_start name 
    crs_stop name 如果不行就加上 -f 参数看一下。 
    是什么原因造成的,这个就要看log日志了。 Oracle RAC 启动与关闭
    http://blog.csdn.net/tianlesoftware/archive/2010/03/05/5349003.aspx在这篇里有相关操作步骤。 
    我的blog上还有一些RAC 理论相关的东西。 可以看看。 对理解这些问题有帮助。 
      

  2.   

    非常谢谢您的回复,我 最开始 调整成的 情况如下 :[oracle@node2 node2]$ /opt/ora10g/product/10.2.0/crs_1/bin/crs_stat -t
    Name           Type           Target    State     Host
    ------------------------------------------------------------
    ora....B1.inst application    ONLINE    ONLINE    node1
    ora....B2.inst application    ONLINE    OFFLINE
    ora.RACDB.db   application    ONLINE    ONLINE    node2
    ora....SM1.asm application    ONLINE    ONLINE    node1
    ora....E1.lsnr application    ONLINE    ONLINE    node1
    ora.node1.gsd  application    ONLINE    ONLINE    node1
    ora.node1.ons  application    ONLINE    ONLINE    node1
    ora.node1.vip  application    ONLINE    ONLINE    node1
    ora....SM2.asm application    ONLINE    ONLINE    node2
    ora....E2.lsnr application    ONLINE    ONLINE    node2
    ora.node2.gsd  application    ONLINE    ONLINE    node2
    ora.node2.ons  application    ONLINE    ONLINE    node2
    ora.node2.vip  application    ONLINE    ONLINE    node2
    也就是,只有ora....B2.inst处于OFFLINE状态,其他都是ONLINE状态,此时 使用 tail -f /u01/app/oracle/admin/+ASM/bdump/alert_+ASM2.log  查看 ASM日志,得到最后的输出是
    “Wed Sep 22 10:58:38 2010
    NOTE: recovering COD for group 1/0xba7eb4fb (RAC_DISK)
    SUCCESS: completed COD recovery for group 1/0xba7eb4fb (RAC_DISK)”。过了十秒钟,期间我没有任何操作,然后[oracle@node2 node2]$ /opt/ora10g/product/10.2.0/crs_1/bin/crs_stat -t
    Name           Type           Target    State     Host
    ------------------------------------------------------------
    ora....B1.inst application    ONLINE    ONLINE    node1
    ora....B2.inst application    ONLINE    OFFLINE
    ora.RACDB.db   application    ONLINE    ONLINE    node2
    ora....SM1.asm application    ONLINE    ONLINE    node1
    ora....E1.lsnr application    ONLINE    ONLINE    node1
    ora.node1.gsd  application    ONLINE    ONLINE    node1
    ora.node1.ons  application    ONLINE    ONLINE    node1
    ora.node1.vip  application    ONLINE    ONLINE    node1
    ora....SM2.asm application    ONLINE    OFFLINE
    ora....E2.lsnr application    ONLINE    OFFLINE
    ora.node2.gsd  application    ONLINE    ONLINE    node2
    ora.node2.ons  application    ONLINE    ONLINE    node2
    ora.node2.vip  application    ONLINE    ONLINE    node1
    也就是,node2节点上的asm、listener自动变成了OFFLINE状态,此时 使用tail -f /u01/app/oracle/admin/+ASM/bdump/alert_+ASM2.log 查看 ASM日志,得到最后的输出是
    “Wed Sep 22 11:00:18 2010
    Shutting down instance (abort)
    License high water  = 1
    Instance terminated by USER, pid = 30240”。我想不出来,这个提示“Wed Sep 22 11:00:18 2010
    Shutting down instance (abort)
    License high water  = 1
    Instance terminated by USER, pid = 30240”说明了什么呢?怎样进一步确定错误原因呢?
    非常谢谢大家啊。
      

  3.   


    非常谢谢,我是在 VMware中 建立 RedHat Linux 4,然后安装10g RAC,虚拟机中 设了2个网卡,全是 Bridged方式的,一共2个节点。机器的网络不太稳定的话,怎么处理呢?非常谢谢大家啊。
      

  4.   

    我是在笔记本上模拟RAC的, 笔记本的配置还是很高的,今年华硕的新机器, Intel的 i3处理器, 这样的配置,是否不够呢?
      

  5.   


    我使用笔记本测试RAC的,在家里,ADSL上外网,没有其他网线了, 这个条件,VMware下的网络不稳定,那怎么调整呢?这个问题,困扰我了大半年了,已经。非常谢谢大家啊。
      

  6.   

    以前我有一个笔记本,就是因为 VMware 来 模拟安装RAC后,出现了 crs_stat -t 看到的 状态经常变化,以至于无法进一步 测试和学习, 所以我今年才买了一个新的 好配置的  笔记本, 但是仍然出现这样的问题。我估计,即使重装,应该还是这样。 不知该怎么处理呢?非常谢谢大家啊。
      

  7.   

    换一下vmware版本试试呢?你什么版本的。
      

  8.   

    我的VMware的版本是 1.0.6 server的, 2.0的版本用不习惯。