因为搭建ceph目的是用于运行虚拟机,前面段时间测试过ceph,出现里一些问题,比如说一个节点(服务器)断开,导致别的节点大量读写数据,cpu负载过高; 服务器时间不同,导致ceph数据不一致;  最严重到是所有节点关掉后再启动起来,ceph不能运行,可怕到是上面到数据也全部丢失。最近因为项目被催的要上线,看看大家对ceph到一些新的见解。。分布式存储,存储虚拟机

解决方案 »

  1.   

    1.1个节点断开,文件读写的负载肯定会转移到其他节点上,这是肯定的。不知道你断掉的是OSD节点还是MDS?
    其他节点的负载过高,是不是数据的反复问都集中到几台服务器上了?再强大的文件系统也有负载限制的吧?
    2.服务器的时间不同,很可能导致ceph数据不一致。ceph的数据更新日志是要打时间戳的吧,如果你底层的OSD节点上搭载的是Btrfs文件系统,也是要打时间戳的,你的服务器时间不一致,可能会带来这个问题
    3.所有节点关掉后,数据丢失,是不是因为你在搭建ceph环境时ceph文件系统原先挂载的目录也失效了,所以所有的数据都找不到了?
    个人见解,对你搭建的环境不是太了解
      

  2.   

    我也是用于虚拟机存储的,测试了一段时间,也经过了故障测试,没有发现问题.比sheepdog和glusterfs都好多了