首页 理论教育数字文化存储系统:文化科技融合初探

数字文化存储系统:文化科技融合初探

【摘要】:数字文化的物理数据是实际存放在存储设备上的数据。档案存储系统主要利用光盘库、磁带库等与磁盘或磁盘阵列、内存构成3级存储系统,利用光盘、磁带等脱机保存档案信息。目前的大型档案存储系统产品主要有磁盘阵列、磁带库、光盘库等。但无论FC SAN还是IPSAN,其本质均是以块设备,如磁盘阵列、磁盘驱动器、磁带库、光盘库等为基础,构成集中管理的存储区域网。

数字文化物理数据是实际存放在存储设备上的数据。逻辑数据通过数据库管理系统能被转换成物理数据。物理数据描述指数据在存储设备上的存储方式,例如,物理联系、物理结构、物理文件、物理记录等术语,都是用来描述存储数据的细节。在存储器中用到下列数据描述的术语:

(1)位(Bit):一个二进制位称为“位”,也称“比特”。“位”只能取“0”或“1”两个状态之一。

(2)字节(Byte):8位为一个字节,可以存放一个字符所对应的ASCII码。

(3)字(Word):若干个字节组成一个字。一个字所含的二进制位的位数称为字长。各种计算机的字长是不一样的,例如有8位、16位、24位、32位等。

(4)块(Block):内存储器和外存储器交换信息的最小单位,又称为物理块或物理记录。每块的大小通常为256B、512B、1 024B等。

(5)卷(Volume):一个输入输出设备所能装载的全部有用信息,称为“卷”。例如,磁带机的一盘磁带就是一卷,磁盘的一个盘组也是一卷。

信息存储系统分为便携式存储系统和档案存储系统。便携式海量存储系统主要由便携式微型磁盘阵列(如1.8英寸、1英寸、0.85英寸微硬盘等)组成,适用于便携式移动应用和消费电子,如数码摄像机、笔记本电脑等日益增长的存储需求。

档案存储系统主要利用光盘库、磁带库等与磁盘或磁盘阵列、内存构成3级存储系统,利用光盘、磁带等脱机保存档案信息。

目前的大型档案存储系统产品主要有磁盘阵列、磁带库、光盘库等。其中,磁盘设备由于存取速度快、数据查询方便、安全的RAID技术等占据了一级存储市场的主要份额,磁带设备则以技术成熟、价格低廉等优点占据了二级存储市场的重要地位,光盘设备由于同时具有二者的特点而应用在广泛的领域中。

(1)磁带库存储。(www.chuimin.cn)

磁带库是集中式网络数据备份的主要设备,其存储容量可达到数百PB(106GB),可在驱动管理软件控制下,实现自动搜索磁带、连续备份、智能化恢复和实时监控,整个数据存储备份过程完全自动化,且系统存储数据的安全性高,扩展能力也很强。磁带库很容易完成远程数据访问、数据备份,或通过磁带镜像技术实现多磁带库备份,从而满足高速、高效、高存储容量的需求,它很适合于备份、存储和归档应用,可为数字图书馆和其他企业存储提供有力保障。

(2)磁盘阵列海量存储。

磁盘阵列全称为廉价磁盘冗余阵列(Redundant Array of Inexpensive Disks,RAID),是指使用两个或两个以上同类型的磁盘,在磁盘控制器管理下按照一定规则组成特定磁盘组合。

磁盘阵列是服务器存储技术中比较成熟的一种,其特点是安全性高、速度快、容量大,并有较强的容错能力。磁盘阵列通过采用交叉存取和数据校验,提高了读写速度,它能有效地避免一个或多个磁盘发生故障时数据丢失,并能够在更换损坏磁盘后快速恢复数据,从而保证了系统的高可靠性。

针对不同的应用磁盘阵列具有多种不同级别:RAID0、RAID1、RAID2、RAID3、RAID4、RAID5、RAID6、RAID10、RAID0+1等。不同的RAID级别特点也不相同,某些级别的RAID技术可以把磁盘的读写速度提高到单个硬盘的数倍,而某些级别的RAID技术可以在牺牲容量的前提下提高安全性能。高端存储中较常使用RAID5技术。RAID5是一种旋转奇偶校验独立存取阵列,RAID5内允许在同一组内并发进行多个写操作;同时,RAID5阵列配合热插拔技术,可以实现数据的在线恢复,所以RAID5适于大数据量的操作,也适于各种事务处理。

网络存储涉及网络存储设备(包括附网存储设备、存储区域网络、SCSI设备、磁盘阵列、磁带机、光盘库等)、存储交换机、主机总线适配器、存储路由器、存储网关、服务器等。

DAS(直接连接存储)存储设备直接连接在各种服务器和主机上,完全以服务器为中心,通常与服务器的物理位置比较接近。目前,以服务器为中心的数据存储模式逐渐向以数据为中心的数据存储模式转化。

NAS(网络连接存储或附网存储)是指把集成的存储系统使用公共通信协议(如TCP/IP)接入信息网络的一种技术。NAS的操作系统是专用的,管理磁盘和网络传输效率较高。其优点是技术成熟,安装和管理简单,弱点主要是对网络资源的争用和系统规模的扩展受限。NAS是真正即插即用的产品,物理位置灵活,可在不间断网络运行的情况下增加或设置存储,能够满足全天候服务的需求。适合于投资有限,但需要大量文件共享的环境,如办公自动化系统、FTP文件服务器系统等。

SAN(存储区域网)将数据存储设备从服务器中分离出来,用区域网连接,进行集中管理,使网络中的任何主机可以访问网络中的任何一个存储设备,从而实现数据共享。目前的SAN主要基于光纤通道(Fibre Channel),即FC SAN,现在又推出了以IP协议为基础的IPSAN。但无论FC SAN还是IPSAN,其本质均是以块设备,如磁盘阵列、磁盘驱动器、磁带库、光盘库等为基础,构成集中管理的存储区域网。SAN具有结构灵活、性能高、可扩展性好等特点。在银行数据存储、电视台的专业视频信息存储等领域得到了良好的应用。此外,近年来新发展起来的ISCSI存储(IP存储)技术在一些行业已经兴起。