庭园设计也受时尚的影响,它总是随着人们的品位和生活方式的改变而改变。图8-95自然式的私家园林图8-96布伦海姆园8.3.2.2东方式庭园东方式庭园,特别是中国的传统庭园,一直是东西方文化灵感的源泉。东方的设计风格基本上是一种趋向于自然的风格,经常借自然山水表意。......
2023-10-03
1.设计准则
(1)行键设计
读访问模式:通过行键索引提升查询效率。HBase中唯一可用的索引只有行键索引,需要对行键精心设计来尽可能地优化数据查询。某项数据放在行键中会得到更好的查询性能,但是行键的长度变长,行键索引会占用更多的内存资源。由于行键在每个列族中保存,也会需要更多的磁盘空间。
写访问模式:避免在同一时间段写入的数据形成热点。随机前缀:在原先彼此相邻的行键前面加上一个随机生成的前缀。哈希前缀:针对随机前缀生成的行键具有不确定性的缺陷,哈希前缀做了改进,通过对原行键调用选定的哈希函数生成前缀。反转键:将原先彼此相邻的行键按字节序反转生成新的行键。以上几种策略都会失去数据按特定行键顺序存放的特性,在进行范围查询时需要访问全部索引数据且需要有更多的磁盘IO操作,对性能影响很大。最理想的行键设计方法是既能让有关联的数据集中在一起存放,又能达到写负载均衡的目的。
行键长度:平衡查询性能和内存占用。常用的行键设计策略:优先考虑节省系统资源,设计有意义但尽可能短的行键;优先考虑查询性能,在资源允许的情况下尽可能实现查询优化;兼顾资源使用和查询性能,行键的设计仅考虑经常执行的关键查询优化。如果将行键设计为二进制字节型数据类型,可以在不牺牲行键内容的情况下明显缩短行键长度,但缺点是行键的可读性变得很差。
(2)列族划分
每张表的列族数能少则少,尽量不超过三个。将有相同访问模式的所有数据存储在同一列族,不同访问模式的数据存储在不同列族,并在列族属性中定义好访问模式。如果某些列数据经常被一起访问而不需要访问其他列的数据,可考虑将这些列划分为一个列族。列族和列的名字应尽量短,建议列族名用一个字母表示,列修饰符用少数几个字母表示。为了提高读性能,可进行反规范化设计,即在多张表中储存冗余数据。冗余设计会对写性能有影响,也会加大应用程序的复杂度。HBase不支持跨行事务,所以在列族设计时要避免一个事务涉及多行数据。
(3)数据量估算和控制
每个单元的大小最好不超过100K,如果超过100K应考虑使用MOB(Medium-sized Objects)文件存储,如果超过50M则应考虑将数据保存在HDFS文件中,在HBase中仅保存文件的访问路径。每个HRegion的大小最好在10G~50G之间,每张表的HRegion数量以不超过100个为宜。在创建表的时候预估数据量,据此预分配足够数量的HRegion,从而避免或减少日后对HRegion的拆分。对于不需要长期保存的数据,设置合理的数据过期时间。版本数量尽可能设置得小一些或使用默认值1。如果表中储存的是基于时间的设备数据或日志信息,可将行键设计为设备ID/服务ID加上时间。
(4)内存需求估算和配置
内存需求。集群中所有MemStore合计所需的最大内存通过下列公式估算:Mem Store大小×HRegion数量×每个HRegion中平均列族数。内存供给:集群参数hbase.regionserver.global.memstore.size配置了每个HRegionServer允许的所有MemStore合计大小上限,该配置值乘以HRegionServer数量即为整个集群的内存供给。如果因为HRegion数量过大造成MemStore内存需求远大于实际内存供给,则会导致系统频繁地进行MemStore存盘操作而影响性能。
2.列族属性
BLOOMFILTER:定义布隆过滤器类型,默认为ROW。NONE:表示不使用布隆过滤。ROW:表示使用基于行的布隆过滤。ROWCOL:表示使用基于行和列的布隆过滤。
COMPRESSION:是否以压缩方式在磁盘上存储列族数据及压缩编码格式,默认值为NONE。NONE:表示不压缩。GZ:表示采用GZ压缩算法。LZ4:表示采用LZ4压缩算法,该算法在Hadoop库中提供。LZO:表示采用LZO压缩算法,该算法库需由用户自行安装。SNAPPY:表示采用SNAPPY压缩算法,该算法库需由用户自行安装。
DATA_BLOCK_ENCODING:定义数据块编码格式,默认值为NONE。NONE:表示不使用压缩编码格式。PREFIX:表示使用前缀编码格式。DIFF:表示使用差异编码格式。FAST_DIFF:表示使用快速差异编码格式。PREFIX_TREE:表示采用前缀树编码格式。(www.chuimin.cn)
VERSIONS:定义列族单元保存的数据版本数量,默认值为1。
MIN_VERSIONS:定义列族存储的最少版本数,默认值为0。
TTL:定义数据的生存时间,以秒为单位,默认值为FOREVER,表示永远不过期。
KEEP_DELETED_CELLS:定义在主压缩时是否清除带有删除标志的数据以及在查询时是否返回带有删除标志的数据,默认值为false。
BLOCKSIZE:定义HFile数据块的大小,默认值为64K。
BLOCKCACHE:定义是否在内存中缓存数据块,默认值为true。
IN_MEMORY:定义列族是否优先放入块缓存中,默认值为false。
REPLICATION_SCOPE:定义列族是否在其他HBase集群中复制以及复制份数,默认值为0,表示不在其他集群中复制。
3.表属性
SPLITS、SPLITS_FILE、NUMREGIONS、SPLITALGO:对表进行预拆分,有如下预拆分方法:提供拆分点数组,对应的表属性为SPLITS;将拆分点保存在文本文件中,对应的表属性为SPLITS_FILE;通过给出HRegion数量和拆分算法来自动计算出拆分点,对应的表属性分别是NUMREGIONS和SPLITALGO。
READONLY:定义只读表。
DURABILITY:定义WAL日志的持久化策略,默认值为USE_DEFAULT。SYNC_WAL:表示采用同步方式写WAL日志。ASYNC_WAL:表示采用异步方式写WAL日志。FSYNC_WAL:表示采用同步方式写WAL日志,并且强制将WAL刷新到磁盘上。SKIP_WAL:表示不写入WAL日志。USE_DEFAULT:表示使用HBase的全局默认值SYNC_WAL。
MAX_FILESIZE:定义该表的每个HRegion中所有HFile合计大小上限,默认值为集群配置项hbase.hregion.max.filesize的配置值。
MEMSTORE_FLUSHSIZE:定义表的MemStore大小上限,默认值为集群配置项hbase.hregion.memstore.flush.size的配置值。
有关大数据挖掘技术及其在医药领域的应用的文章
庭园设计也受时尚的影响,它总是随着人们的品位和生活方式的改变而改变。图8-95自然式的私家园林图8-96布伦海姆园8.3.2.2东方式庭园东方式庭园,特别是中国的传统庭园,一直是东西方文化灵感的源泉。东方的设计风格基本上是一种趋向于自然的风格,经常借自然山水表意。......
2023-10-03
数据库的概念模式设计首先涉及的是数据库模型设计。数据库模型设计常用的建模方法有以下几种。其中,E-R模型使用较多,因此这里对E-R模型进行简单介绍。矩形和菱形之间由有向弧连接,在弧上往往标注两个实体间的联系是1∶1、1∶n或m∶n,分别表示实体间的一对一关系、一对多关系和多对多关系。图3.2E-R模型示例如图3.2所示,实体“学生”和实体“课程”形成了一个多对多(m∶n)的关系。......
2023-10-28
第二章推广组织概述本章导读:●推广组织架构的主要类型●推广组织架构设计的原则和内容●推广组织设计范本●推广组织冲突管理管理具有二重性。事业部独立负责产品线的产品市场推广,销售业绩是重要的考核指标。图2-3第二阶段处于这一阶段的企业,逐渐暴露出了基层推广人员短缺的问题。......
2023-12-06
ModBus控制系统的技术特征:1)ModBus通信协议是一种工业现场总线通信协议,ModBus协议把通信对象定义为“主站”和“从站”。图1-18 用网关来实现现场总线和管理网络的互联图1-19 ModBus协议和ISO/OSI参考模型的关系......
2023-08-29
而入侵防护系统则倾向于提供主动防护,其设计宗旨是预先对入侵活动和攻击性网络流量进行拦截,在恶意行为被发现时及时进行阻止,避免其造成损失,而不是简单地在恶意流量传送时或传送后才发出警报。IPS实现实时检查和阻止入侵的原理在于IPS拥有数目众多的过滤器,能够防止各种攻击。由于网络入侵威胁的动态特性,在进行网络部署时,综合考虑两种类型的IPS,将会提供更好的防护。......
2023-11-25
借助谈话、讨论和交流,帮助幼儿在生活经验的回忆和梳理过程中形成“早、中、晚”和“白天、黑夜”的正确时间概念。图8-5幼儿园食谱表2.唤起形象感知,体验时间顺序为了丰富幼儿的生活经验,利用幼儿已有表象来加强其对“白天与黑夜”和“早、中、晚”的认识,教师在教学活动设计中还可以使用丰富的教学手段和途径,利用形象化的视觉图片,在视听同步的感知和体验过程中,加深幼儿对时间概念的理解。......
2023-07-30
人是运动训练管理中最积极和潜力最大的因素。只有对运动训练中的人进行科学有效的管理,协调好各方关系,充分调动其积极性,才能更好地提高运动训练管理的效果。按照不同层次教练员与运动员之间的限额比例确定各项目教练员人数。运动训练计划实施中的指导,主要是训练职能部门或管理者督促下属管理者、教练员完成计划规定任务的训练管理活动或方式,以及运动训练过程的方法、手段的指导和帮助。......
2023-11-17
将待洗车辆按要求开到清洗工位,拉起驻车制动。关于清洗剂的调配,须严格按照各品牌的配比要求执行,既要保证清洗能力,又要避免不必要的浪费。擦清洗剂将已调配好的清洗剂用海绵均匀擦拭车身表面。水磨后还要进行最后一次清洗擦干。......
2023-09-29
相关推荐