谷声呼叫平台服务的数据由于系统开发委托于不同的开发商,导致数据分散在不同数据库中,不仅不便于管理,而且数据库中存在着大量过时不可用的数据,成为影响数据库分析应用的垃圾数据。基于元数据的多源数据交换系统的主页面展示如图8所示。图9元数据配置页面......
2023-10-21
基于多源数据集成得到的数据进行深化挖掘,架构一般可分为五层,如图10所示。此外,设置平台管理层,确保整个数据处理平台平稳安全运行的保障。
图10 Hadoop优化架构
(1)数据集成层。数据集成层是基于元数据的多源数据交换平台的基础架构。在源和文件存储层或数据存储层之间进行适配,以实现双向的数据高效导入导出。数据集成层组件的典型实例就是Sqoop工具。利用Sqoop工具,一方面可以将存储于关系型数据库中的数据导入Hadoop组件中以利于MapReduce程序或Hive工具进行后续处理,甚至直接导入HBase中;另一方面还可以支持将处理后的结果导出到关系型数据库中。
(2)文件存储层。文件存储层是利用分布式文件系统技术,将底层数量众多且分布在不同位置的通过网络连接的各种存储设备组织在一起,通过统一的接口向上层应用提供对象级文件访问服务能力。文件存储层为上层应用屏蔽了存储设备类型、型号、接口协议、分布位置等技术细节,提供了数据备份、故障容忍、状态监测、安全机制等多种保障可靠的文件访问服务的管理性功能。利用分布式并行技术,云计算大数据处理环境下的文件存储层还支持对海量大文件进行高效的并行访问。向上为编程模型层和数据存储层提供文件访问服务。HDFS是文件存储层的一个典型组件。(www.chuimin.cn)
(3)数据存储层。数据存储层提供了分布式、可扩大的大量数据表的存储和管理能力。与传统的关系数据库不同,基于Hadoop的大数据处理架构中的数据存储层组件不要求完整的SQL支持能力,也不要求采用关系型数据模型存储数据。它强调的是在较低成本的条件下实现大数据表的管理能力,可支持在大规模数据量的情况下完成快速数据读写操作,且可以随着数据量激增,通过简单的硬件扩容实现存储能力的线性增长。Hadoop已为数据存储层提供了两项技术基础:HBase和HCatalog。HBase实现了一个面向列的分布式数据库存储系统。HCatalog是一个数据表和存储管理组件,可以支持Pig、Hive、MapReduce等上层应用间进行数据共享操作。
(4)编程模型层。编程模型层中的组件作用是为大规模数据处理提供一个抽象的并行计算编程模型,以及为此模型提供可实施的编程环境和运行环境。编程模型层是整个处理架构的核心部分,其运行效率决定了整个数据处理过程的效率。MapReduce模型作为Hadoop技术的核心,可以直接构建数据处理程序;另一方面上层的拓展工具Hive等可以进行数据访问和分析。
(5)数据分析层。Hadoop体系中的Pig提供了一个在MapReduce基础之上抽象出的更高层次数据处理能力,包括一个数据处理语言及其运行环境。而Hive则可以将结构化的数据映射为一张数据表,为数据分析人员提供完整的SQL查询功能,并将查询语言转换为MapReduce任务执行。
(6)平台管理层。平台管理层中的组件是确保整个数据处理平台平稳安全运行的保障。跟其他系统中的管理组件相同,平台管理层中的组件提供了包括配置管理、运行监控、故障管理、性能优化、安全管理等在内的全套功能。Hadoop中提供了ZooKeeper,主要提供配置管理及组件协调功能,Ambrari提供了一个用于安装、管理和监控Hadoop集群的Web界面工具。
有关2017年软件工程论文专集的文章
谷声呼叫平台服务的数据由于系统开发委托于不同的开发商,导致数据分散在不同数据库中,不仅不便于管理,而且数据库中存在着大量过时不可用的数据,成为影响数据库分析应用的垃圾数据。基于元数据的多源数据交换系统的主页面展示如图8所示。图9元数据配置页面......
2023-10-21
智慧旅游管理平台一般包括智慧旅游目的地管理平台、智慧旅游行业监督管理平台和智慧旅游安全保障管理平台,其中三大平台又包括各自的子平台。通过智慧旅游管理平台,政府部门管理者可以及时、有效地对旅游目的地的旅游相关信息进行把握,进而做出合理的旅游决策。......
2023-11-04
图5-1-5区县级运行管理平台架构图区县级运行管理平台技术要求:区县级平台实现对全县所有台站播出信号、设备运行、电力和环境、机房安全防范进行远程监测、监控和管理,具备运行异态实时报警、监控数据自动记录以及网络化传输管理等功能。区县级平台通过登录州市级平台的方式实现上述系统的远程监测、监控和管理功能。以太网接口应符合IEEE 802.3,物理层接口采用10BASE-FL、100BASE-FX、1000BASE-SX、1000BASE-LX。......
2023-06-24
从当前现状来看,各类中小教育机构打造学习平台主要有三种模式,一是自己建设,二是购进商业软件,三是租赁在线学习平台。图6-17是学习平台多租户体系架构。在图6-17所示的架构中,基于较高层次的SaaS成熟度模型,构建适合学习平台的多租户模式,实现系统整体的松耦合,为未来平台扩展奠定基础。......
2023-11-30
裴盈盈、袁国宏认为,应该着力打造智慧旅游中央管理平台。根据国内外城市推进智慧旅游建设的实践经验,智慧旅游中央管理平台主要是由政府主导,各旅游企业支持建造的一个统一的权威的网络信息数据库。图2-1为其所构建的智慧旅游管理平台的架构模型。......
2023-11-04
图7-5仿真开发环境界面2. Agent 间协商机制过程描述如第三章所述, 本节生产计划仿真平台所采用的协商机制是改进后的合同网机制。......
2023-06-20
开放远程教育是教育信息化应用的重要领域,基于教育信息化云服务平台技术架构,我们设计了一个区域开放远程教育云服务平台技术架构,可用于构建新型开放教育系统参考。......
2023-11-30
数据剖析,也称为数据概要分析,或者数据探查,是一个检查文件系统或者数据库中数据的过程,由此来收集它们的统计分析信息。数据剖析不仅有助于了解异常和评估数据质量,也能够发现、注册和评估企业元数据[48]。传统的数据剖析主要是针对关系型数据库中的表,而新的数据剖析将会面对非关系型的数据、非结构化的数据以及异构数据的挑战。多源数据的统计信息则包括主题发现、主题聚类、模式匹配、重复值检测和记录链接等[47]。......
2023-06-23
相关推荐