首页 理论教育云存储:海量高性能低成本,深度剖析及应用实践

云存储:海量高性能低成本,深度剖析及应用实践

【摘要】:云存储已经成为近年来增长最快的云服务之一。与传统的网络存储方式相比,云存储的最大特点是海量、高性能及低成本。公有存储云 公有存储云以较低的成本提供大容量、高性能及可弹性扩展的云存储服务。

云存储是从云计算的概念里延伸出来的新技术之一。它连接了各种不同类型的网络存储设备,并为使用者提供与支持各种在线存取服务。国内外许多著名的IT公司,如亚马逊谷歌和微软等都已在这方面投入巨资,成为云存储服务提供商。云存储已经成为近年来增长最快的云服务之一。

1.云存储概述

云计算的出现给网络数据存储带来了新的革命。与传统数据存储相比,基于云的数据存储,用户无须了解存储设备的型号、使用的接口和传输协议,就可以从任何具有互联网访问能力的地方随时访问所需数据,由此延伸和发展出云存储这一新概念。

云存储是指通过分布式文件系统、基于TCP/IP的网络技术、虚拟化技术和集群环境,将网络中种类繁多、配置和性能各异的存储设备通过应用软件集合起来协同工作,作为一个整体对外提供数据存储服务和基于存储数据的各类业务应用。从用户角度来讲,云存储就是通过网络把数据存放到远程第三方的服务器上而非存到本地的硬盘。

用户使用云存储并不是使用某个特定的存储设备,而是使用整个云端存储系统带来的数据存储服务和数据访问功能。因此,从使用角度来讲,云存储不是指存储本身,而是一种新的服务模式。

作为一种新型的云服务模式,云存储必然要求存储架构保持极低的成本。从Google公司的实践来看,它们在现有的云环境中并没有采用传统的以网络为中心的存储结构如SAN架构,而是使用了可扩展的分布式文件系统GFS。这是一种高效的集群存储技术。

云存储的兴起正在颠覆现有的网络存储方式,通过使用云存储,存储变为了一种按需使用的服务,用户可以根据需要定制所需的存储服务,无须前期投资且无日后的维护费用,从而大大降低用户软硬件的开销和日常维护成本。

与传统的网络存储方式相比,云存储的最大特点是海量、高性能及低成本。另外,云存储还可以提供更加安全、便捷的数据备份服务和数据访问方式。所以建立扩展性强、性价比高、吞吐率高和容错性高的云端存储系统势在必得。

2.云存储的分类

按照云存储的使用性质可以将云存储分为公有存储云、私有存储云、内部云存储和混合存储云四类。

(1)公有存储云 公有存储云以较低的成本提供大容量、高性能及可弹性扩展的云存储服务。服务提供商可以保证每个客户对存储的使用都是独立的、私有的。

DropBox提供的个人云存储服务是公有存储云应用中的典型代表。

(2)私有存储云 私有存储云是针对公有存储云来说的。其应用局限在一个区域、一个企业,甚至一个家庭内部。

公有存储云可以把其中一部分划出作为私有存储云。通常一个公司拥有或控制其基础架构以及应用服务的部署。私有存储云通常部署在企业的数据中心,可以由自己进行管理,也可以交由服务提供商管理。

(3)内部存储云 与私有存储云比较类似,唯一不同的是它位于企业防火墙内部。

(4)混合存储云 混合存储云把公有存储云和内部/私有存储云结合在一起,主要用于按客户要求的访问,特别是当客户需要动态配置存储容量的时候,从公有存储云中划出一部分容量配置给私有存储云或内部云存储使用,可以帮助公司应对迅速增长的负载波动或高峰时段的容量需求。

3.云存储的结构模型

云存储不只是一个硬件设备,而是一个由服务器、存储设备、网络设备、应用软件及客户端程序等多个部分组成的复杂系统。各部分以存储设备为基础通过网络和虚拟化等技术对外提供数据存储和数据访问管理服务。

云存储按照其体系结构可分为四层,从上到下依次为访问层、应用接口层、基础管理层和存储层[14,15],如图4-3所示。(www.chuimin.cn)

978-7-111-53353-5-Chapter04-3.jpg

图4-3 云存储的结构模型

(1)存储层 存储层是云存储中最基础的部分,是云存储得以实现的物理基础,主要负责存储用户的文件信息。

存储层所包含的存储设备通常数量巨大且分布在不同的地理区域,彼此间通过互联网连接成一个整体。在硬件存储设备之上是一个存储设备管理系统,用于实现对硬件存储设备的逻辑虚拟化管理、状态监控、故障检测与维护和多链路冗余管理等功能。存储设备模式多样,包括光纤通道(FC)存储设备、NAS和iSCSI等IP存储设备、SCSI或SAS等DAS存储设备。

(2)基础管理层 基础管理层是云端存储系统中最为核心的功能,也是云存储中最难以实现的部分。基础管理层通过集群、分布式文件系统和分布式计算等技术,实现云存储中多个存储设备之间的协同工作,使多个存储设备可以对外提供同一种服务,并提供更好的数据访问性能。

当用户使用云存储服务时,将私有数据转移到云端进行存储,首先关心的问题就是数据的安全性。在保证数据安全性方面,云存储除了使用可以保证数据不会被非法用户所访问的数据加密技术外,云端存储系统还为同一份数据存储多个副本,同时使用合理的副本布局策略将其尽可能地分散存储。这样可以保证当某一节点突发宕机而导致该节点上的数据不可用时,系统可以使用数据的其他副本来完成请求,或者在某一数据发生突发性损坏时可以使用其他副本数据进行修复,从而提高数据的安全性。

数据压缩技术可以对数据进行有效压缩,既能保证不丢失信息又能缩减存储空间,提高数据传输和存储效率

(3)应用接口层 应用接口层是云存储结构中最灵活的部分。不同的云存储服务提供商根据业务的类型,为使用者提供不同的应用服务接口。

(4)访问层 访问层是云存储服务运营商提供给用户使用的客户端应用程序,通过此类客户端程序,任何授权的用户都可以登录云端存储系统,享受云存储服务。随云存储服务运营商提供的应用服务和接入方式不同,其访问方式也不同。

4.典型云端存储系统

过去几年,国内外公司纷纷抢占云存储服务市场,云存储服务提供商如同雨后春笋层出不穷。国外主流云存储服务提供商包括DropBox、Amazon、Google、IBM和iCloud等;国内主流云存储服务提供商包括网易、腾讯、金山、百度新浪和七牛等。这些云存储服务各有优缺点,但都提供了基本额度的免费空间,当使用者有更大空间需求时,可再通过付费的方式增加可用的空间。

(1)亚马逊云存储 亚马逊是最早提供云存储服务和云存储应用的公司之一。为了使公司一些闲置的硬件资源得到更充分地利用,亚马逊公司于2006年开始对外提供简单存储服务(S3)。由于服务稳定、存储费用低廉,S3获得广大用户的青睐。同时S3提供的Web Services为开发者提供了开发接口,并允许第三方工具在S3上开发,而用户只需根据收费标准支付一定的费用即可享用云存储服务。

2008年8月,亚马逊为了增强它在云存储战略上的竞争力,其互联网服务部门将“持续存储”功能添加到弹性计算云(EC2)中,并推出了弹性块存储EBS产品,声称这个产品可以通过互联网服务形式同时提供存储和计算功能。

目前,S3支持用户上传不大于5TB的单个文件。

(2)谷歌云存储 Google公司在2011年推出云计算存储服务Google Cloud Storage。从功能设计上来看,Google Cloud Storage与亚马逊S3类似。为了方便S3用户转用Google Cloud Storage服务,在数据访问方面,Google Cloud Storage为用户提供了Web访问接口,用户可以直接使用浏览器进行认证和登录,然后对自己上传的文件进行查看、管理和共享等操作。

Google Cloud Storage在容量方面扩展性强,可对外提供总容量高达16TB的云空间存储服务。

(3)微软云存储 SkyDrive是2007年8月由微软所推出的Windows Live服务的一部分。该服务允许使用者将他们的文档上传到网络服务器。另外,SkyDriver通过Windows Live ID来限制不同的使用者能够存储的文档权限,使用者可以决定是否将他们的文档数据与他人分享,或者是限制部分好友可以存取或只有所有者本人可以存取。对所有人公开的文档不需要账号也能读取。

目前SkyDrive提供25GB的容量给用户使用,但限制上传单个文件大小不超过100MB。