可用以衡量塑料强度相关性能的指标主要有拉伸强度、断裂伸长率、弯曲强度及其弯曲模量等。关于塑料增强的机理,目前还未取得共识,这里只介绍几种常见的理论。④叠层增强技术:采用同一种或者不同种塑料,通过特殊的叠层工艺复合方式,实现材料的多级叠层复合,达到增强的效果,目前可以实现超过1万层的复合。......
2023-06-26
1.Hadoop架构
Hadoop架构依据Google研究者所发表的关于BigTable和GFS等学术论文提出的概念克隆而成,因此它与Google内部使用的云端计算架构非常相似。Hadoop在硬件环境上兼容性较高,相对于现有的分布式系统,Hadoop更注重在容错性及廉价的硬设备上,用很小的预算就能实现大数据量的读取。
Hadoop包含有三个核心模块,即HDFS、Hbase和MapReduce。
HDFS为Hadoop Distributed File System的缩写。HDFS由名字节点(NameNode)和数据节点(DataNode)两个角色组成,HDFS是将数据文件以块(Block)方式存储在许多的DataNode上,再通过NameNode来处理和分析。此外HDFS与GFS不同的地方在于,它改进了NameNode的数量,已经不是只有一台NameNode来应付所有可能发生的情形,也大大改善了当只有一台NameNode主机时随时可能会故障的情形。HDFS的主要概念是以有效率的数据处理方式一次写入、多次读取,当数据经过建立、写入后就不允许更改,采用附加的方式,加在原有数据后面。通常数据会以预设64MB为单位切割成区块分散存储在不同数据节点上。而HDFS会将区块复制为多个副本存储在不同的数据节点作为备份。
HBase是一个分布式数据库,建构于HDFS之上。由行与列构成一个数据表,数据表单元格是有版本的,主要的索引为行键(Row Key),由HBase通过主要索引做排序,在同一个Row Key上有着不同版本的时间戳,每写进一次数据表都是一个新的版本。写入的数据都为字符串,并没有形态。当HBase在写入数据时会先写入Log(WAL Log)和目标主机的易失存储器,若主机无法正常运作时,此时使用Log来恢复检查点(Checkpoint)之后的数据,无法搜寻到数据时就会从HDFS中寻找。
MapReduce是一个大型分布式框架,利用大量的运算资源,加速处理庞大的数据量。MapReduce框架是典型的Master/Slaves(主/从)结构,也称为JobTracker-TaskTracker。JobTracker负责资源的管理(节点资源和计算资源等)以及任务生命周期管理(任务调度、进度查看和容错等)。TaskTracker主要负责任务的开启/销毁、向JobTracker汇报任务状态。JobTracker所在节点称为Master,TaskTracker所在节点称为Slaves。Hadoop集群由一个主节点Master和若干个从节点Slaves组成。Hadoop MapReduce的框架如图7-5所示。
图7-5 Hadoop MapReduce框架
MapReduce的处理程序分为两个阶段:Map和Reduce。当数据开始进行运算,系统会将输入和输出都采用Key-value对方式切割成许多部分,分别传给不同的Mapper做处理,在集群中的计算机都会参与运算的过程,位于Master的JobTracker负责发送Map指令或Reduce指令给Slave中的TaskTracker,经由Map处理过后的数据,会暂存在内存内,这些数据称为中介数据,Reduce再将具有相同中介值的数据整合出最后的结果,并存储在用户设定的位置如HDFS。
2.Hadoop的安全问题
对于像金融、政府、医疗保健和其他对敏感数据的访问有严格监管的行业,如若使用Hadoop进行大数据处理,则必须确保Hadoop集群满足如下几个要求:(www.chuimin.cn)
1)周边安全。通过网络安全、防火墙和认证机制等确认用户身份,确保Hadoop集群访问的安全。
2)数据安全。通过屏蔽和加密等技术,保护Hadoop集群中的数据不会被非法访问。
3)访问安全。通过ACL和细粒度授权,定义授权用户和应用程序对集群数据的权限。
但是,Hadoop最初的设想是:Hadoop集群总是处于可信环境中,由可信用户使用的相互协作的可信计算机组成;另外,其应用场景主要是围绕着如何管理大量的公共Web数据,无须考虑数据的安全性问题,因此Hadoop的早期版本中并没有考虑安全性问题。
随着Hadoop在数据分析和处理平台中的地位日益凸显,安全专家开始关注来自Hadoop集群内部的恶意用户的威胁。比如:
1)Hadoop并没有设计用户及服务器的安全认证机制,由于Hadoop并没有设计用户认证,使得任何用户都能冒充其他用户非法访问被冒充用户的HDFS或MapReduce,从而进行一些非法的对被冒充用户有危害的操作,如恶意提交作业、篡改HDFS上的数据和修改JobTracker状态等。尽管在版本0.16以后,HDFS增加了文件和目录的权限,但是由于用户无须认证,HDFS的权限控制还是极其容易绕过,允许一个用户伪装成任意一个用户,同时Hadoop计算框架也没有进行双向验证,一个恶意的网络用户可以模拟一个正常的集群服务加入Hadoop集群,去接受JobTracker和NameNode的任务指派。
2)Hadoop缺乏相应的安全授权机制。Hadoop在DataNode服务器上不仅缺乏相应的认证,而且也缺少相应的访问控制机制。当用户知道BlockID后,可以绕过相对应的认证和授权机制,直接对DataNode上的Block进行访问,而且可以随意写入或修改DataNode上的数据。由于缺乏相应的安全授权机制,用户还可以任意修改或销毁其他用户的作业。
3)Hadoop缺乏相关的传输以及数据加密。虽然在Master与Slave之间、Client与服务器之间的数据传输以Socket方式实现,采用的是TCP/IP,但是在传输和加密时并没有进行加密处理。而且由于各节点之间的数据是通过明文传输的,数据容易在传输的过程中被窃取。
2009年,关于Hadoop安全性的讨论接近白热化,安全被作为一个高优先级的问题被提出。Apache专门为了解决Hadoop的安全漏洞问题组成了一个团队,为Hadoop增加安全认证和授权机制,后来又为其加入Kerberos身份认证和基于ACL的访问控制机制。
有关云安全深度剖析:技术原理及应用实践的文章
可用以衡量塑料强度相关性能的指标主要有拉伸强度、断裂伸长率、弯曲强度及其弯曲模量等。关于塑料增强的机理,目前还未取得共识,这里只介绍几种常见的理论。④叠层增强技术:采用同一种或者不同种塑料,通过特殊的叠层工艺复合方式,实现材料的多级叠层复合,达到增强的效果,目前可以实现超过1万层的复合。......
2023-06-26
本节将简述无人炮塔分类和研制发展情况。图6.3所示分别为安装在装甲车辆上的不同类型的无人炮塔的示意图。这种带武器支座的无人炮塔构造能使自身的质量比同类普通炮塔的质量减轻约20%。遥控式无人炮塔。图6.4英国1968年研制的COMERS 75实验坦克支座式无人炮塔的试验结果达不到预期性能,遥控式无人炮塔的研制开始出现在20世纪80年代。1984年,美国通用动力公司最早试吃螃蟹,在M1坦克底盘制造的试验台上安装无人遥控炮塔。......
2023-06-24
DeviceNet是一种简单的网络解决方案,在提供多供货商同类部件间的可互换性的同时,减少了配线和安装工业自动化设备的成本和时间。DeviceNet是一个开放式网络标准,其规范和协议都是开放的,用户将设备连接到系统时,无须购买硬件、软件或许可权。DeviceNet作为一个低端网络系统,实现传感器和执行器等工业设备与控制器高端设备之间的连接,如图9-1所示。DeviceNet有两个主要用途:1)传送与低端设备关联的面向控制的信息。......
2023-11-22
PROFIBUS是一种国际化的、开放的、不依赖于设备生产商的现场总线标准。2)PROFIBUS-PA:对于安全性要求较高的场合,制定了PROFIBUS-PA协议,这由DIN19245的第四部分描述。由许多短信息组成的长信息包不符合短信息的要求,因此,PROFIBUS不提供这一功能。PROFIBUS广泛应用于制造业自动化、流程工业自动化和楼宇、交通、电力等其他自动化领域,PROFIBUS的典型应用如图6-1所示。......
2023-11-22
1.信息信息和控制是信息科学的基础和核心。信息的概念已渗透到许多不同的学科。因此,信息也是普遍存在的。比如,我国载人航天飞船“神舟九号”与“天宫一号”空间交会对接的现场直播,向全国及世界各地的人们介绍我国航天事业的发展进程,缩短了对接现场和电视观众之间的距离,实现了信息在空间上的传递。信息技术的特点。⑤ 智能化:在面向21世纪的技术变革中,信息技术的发展方向之一将是智能化。信息技术的功能。......
2023-11-01
如图G8.2所示,水库与下游防护地区之间的区间洪水不可忽略,当发生洪水时,水库仅能控制的是入库洪水,因此,为满足防护地区的防洪要求,水库要考虑区间来水大小,进行补偿放水,这种调节洪水的方式称为防洪补偿调节。图G8.2水库与防洪控制点位置示意图设水库A的泄流到防洪控制点B的传播时间为tAB,区间洪水到防洪控制点B的传播时间为tCB。式、式未考虑区间洪水经河槽调节所导致的流量变化。......
2023-06-21
Hadoop技术比较容易由单台服务器扩充到数千台服务器。Spark技术主要提供基于内存计算,能快速进行数据分析,具有通用性,是可扩展的分布式计算引擎。Spark技术在进行数据分析时速度快。Spark技术有Hadoop以及MapReduce的特点,但Spark技术与MapReduce的不同之处是不需要读写HDFS,中间输出的结果保存在内存中。基于Spark技术和Hadoop框架结合的机器学习算法,解决了Mahout在迭代算法处理数据时消耗资源过多和系统整体性能下降的缺陷,提高了数据处理分析的速度[162]。......
2023-11-21
相关推荐