首页 理论教育数据存储基本概念大数据医药领域应用

数据存储基本概念大数据医药领域应用

【摘要】:数据存储系统将收集的信息以适当的格式存放以待分析和价值提取。数据存储系统应该具有如下两个特征:存储基础设施应能持久和可靠地容纳信息;存储系统应提供可伸缩的访问接口供用户查询和分析巨量数据。数据存储设备可以根据存储技术分类。典型的存储技术有如下几种:随机存取存储器;磁盘和磁盘阵列;存储级存储器。图6-1基于SSD的多层存储系统数据存储基础设施:体系结构。

数据存储结构:穿孔纸带结构(非数字化);文件:Text、Excel、XML、JSON;数据库:关系模型、对象图、属性列表等。

数据存储方式:(1)纸带和磁带。(2)数字存储。随机存取存储器(Random Access Memory,RAM)、磁盘(HDD)和磁盘阵列、存储级存储器的闪存和SSD、光盘。

数据存储系统将收集的信息以适当的格式存放以待分析和价值提取。数据存储系统应该具有如下两个特征:存储基础设施应能持久和可靠地容纳信息;存储系统应提供可伸缩的访问接口供用户查询和分析巨量数据。

数据存储功能划分:(1)硬件基础设施,存储技术、体系结构;(2)数据管理软件,文件管理系统、数据库、大数据管理系统。

数据存储基础设施:存储技术。数据存储设备可以根据存储技术分类。典型的存储技术有如下几种:(1)随机存取存储器(Random Access Memory,RAM);(2)磁盘(HDD)和磁盘阵列;(3)存储级存储器。这些存储设备具有不同的性能指标,可以用来构建可扩展的、高性能的大数据存储子系统。

一个典型的基于SSD的多层存储系统,该系统由三个部件构成:I/O请求队列,虚拟化层,阵列。目前,IBM、EMC、3PAR等公司的基于SSD的商用多层存储系统已能获得较好的性能,基于SSD的多层存储系统如图6-1所示。(www.chuimin.cn)

图6-1 基于SSD的多层存储系统

数据存储基础设施:体系结构。从网络体系结构的观点理解存储基础设施,存储子系统可以通过不同的方式组织构建。开放系统的外挂存储:直接附加存储(Direct Attached Storage,DAS)、网络附件存储(Network Attached Storage,NAS)、存储区域网络(Storage Area Network,SAN)。三种存储方式各有优势,相互共存。三种存储技术的存储网络体系架构如图6-2所示。

图6-2 三种存储技术的存储网络体系架构