【摘要】:大数据存储方式:分布式系统。哈希方式是最常见的数据分布方式,其方法是按照数据的某一特征计算哈希值,并将哈希值与机器建立映射关系,从而将不同哈希值的数据分布到不同的机器上。然而NoSQL数据库则可省去这些麻烦,确实是方便快捷。另外,利用面向列的数据库的优势,把它作为批处理程序的存储器来对大量数据进行更新也是非常有用的。但是,由于面向列的数据库跟现行数据库存储的思维方式有很大不同,应用起来是非常困难的。
大数据存储方式:(1)分布式系统。分布式系统可以解决大数据存储的问题,为大数据的存储提供了方式。分布式系统的定义包括两个方面,第一是关于硬件的:机器本身是独立的;第二个方面是关于软件的:对于用户来说,他们就像跟单个系统“打交道”。这两个方面一起阐明了分布式系统的本质,缺一不可。(2)NoSQL数据库。它是“Not Only SQL”的缩写,意义是适用关系型数据库的时候就使用关系型数据库,不适用的时候也没必要非使用关系型数据库不可,可以考虑使用更加合适的数据存储方式。(3)云存储。云存储是伴随着云计算技术的发展衍生出来的一种新兴的网络存储技术,它是云计算的重要组成部分,也是云计算的重要应用之一。它不仅是数据信息存储的新技术、新设备模型,也是一种服务的创新模型。
分布式系统四种常见的数据分布方式:(1)哈希方式。哈希方式是最常见的数据分布方式,其方法是按照数据的某一特征计算哈希值,并将哈希值与机器建立映射关系,从而将不同哈希值的数据分布到不同的机器上。(2)按数据范围分布。按数据范围分布是另一个常见的数据分布方式。将数据按特征值的值域范围划分为不同的区间,使得集群中每台(组)服务器处理不同区间的数据。(3)按数据量分布。与哈希方式和按数据范围分布有所区别的是,按数据量分布数据与具体的数据特征无关,而是将数据视为一个顺序增长的文件。(4)一致性哈希。一致性哈希的基本方式是使用一个哈希函数计算数据或数据特征的哈希值,使得哈希函数的输出值域为一个封闭的环。(www.chuimin.cn)
具有代表性的NoSQL数据库:(1)键值存储。临时性键值存储的特点是在内存中保存数据,可以进行非常快速的保存和读取处理,数据有可能丢失。永久性键值存储的特点是在硬盘上保存数据,可以进行非常快速的保存和读取处理,数据不会丢失。此类型数据库适合处理的数组类型的特点有同时在内存和硬盘上保存数据,可以进行非常快速的保存和读取处理,保存在硬盘上的数据不会消失(可以恢复),适合处理数组类型的数据。(2)面向文档的数据库,其特点主要两个方面:第一,不定义表结构。即使不定义表结构,也可以像定义了表结构一样使用。关系型数据库在变更表结构时比较麻烦,而且为了保持一致性还需要修改程序。然而NoSQL数据库则可省去这些麻烦,确实是方便快捷。第二,可以使用复杂的查询条件。跟键值存储不同的是,面向文档的数据库可以通过复杂的查询条件来获取数据。虽然不具备事务处理和JOIN这些关系型数据库所具有的处理能力,但除此以外的其他处理基本上都能实现,这是非常容易使用的NoSQL数据库。(3)面向列的数据库。面向列的数据库具有高扩展性,即使数据增加也不会降低相应的处理速度(特别是写入速度),所以它主要应用于需要处理大量数据的情况。另外,利用面向列的数据库的优势,把它作为批处理程序的存储器来对大量数据进行更新也是非常有用的。但是,由于面向列的数据库跟现行数据库存储的思维方式有很大不同,应用起来是非常困难的。
相关推荐