分布式数据库技术是分布式技术与数据库技术的结合,在数据库研究领域中已有多年的历史。从概念上讲,分布式数据库是物理上分散在计算机网络各结点上,而逻辑上属于同一个系统的数据集合。它具有数据的分布性和数据库间的协调性两大特点。系统强调结点的自治性而不强调系统的集中控制,且系统应保持数据的分布透明性,使应用程序编写时可完全不考虑数据的分布情况。
在分布式数据库系统中数据独立性概念也同样重要,然而增加了一个新的概念,就是分布式透明性。所谓分布式透明性就是在编写程序时好像数据没有被分布一样,因此把数据进行转移不会影响程序的正确性。
与集中式数据库系统不同,数据冗余在分布式系统中被看作是所需要的特性,其原因在于:首先,如果在需要的节点复制数据,则可以提高局部的应用性。其次,当某节点发生故障时,可以操作其它节点上的复制数据,因此这可以增加系统的有效性。当然,在分布式系统中对最佳冗余度的评价是很复杂的。
在分布式数据库中,数据存储通过以下三种途径实现:
² 复制:系统维护关系的几个完全相同的副本,这些副本存储在不同的结点上。 
² 分片:关系被划分为几个片段,各个片段存储在不同的结点上。 
² 复制+分片:关系被划分为几个片段,系统为每个片段维护几个副本。