传统的企业运维认为,流程是企业IT的核心,不同的规范、监管要求,都是一再强调流程的建立、流程的管理和流程的优化。但事实上,离开了组织文化的熏陶,流程只是一个形式、一具躯壳,并不能有效驱动,达到企业想要的效果。组织文化要让运维人员觉得自己不仅仅是一个为了企业IT正常运转的螺丝钉,而是在服务企业的过程中,能实现员工的自我增值。图1组织文化是规范化运维的核心在整个组织文化层面,人无疑是最重要的。......
2023-10-21
作为一个初创金融企业或者一个运维主管新到一个金融企业,应该怎样做好规范化运维呢?经过多年的金融行业数据库运维服务经验,我们总结了六个步骤,帮助规范化运维有序有效落地,简称“六脉神剑”。
第一“剑”,监控管理。监控和告警可以说是数据库运维的第一课,做好监控管理,可以做到问题及时发现、及时处理,做得更好的,还可以做到故障预警。但监控管理不好做,绝大多数企业的监控指标不是做得太少,而是做得太多。做好监控管理有三个要点:准确、全面、及时。所谓准确就是做一个就有效一个,决不能类似的告警搞很多个,看起来花里胡哨,但告警发出来,却不能引起数据库管理员的注意;所谓全面是要细挖可能需要补增的监控点,点与点之间做到互斥性;再谈到及时是针对告警平台而言,随着互联网技术的发展,企业IT架构越来越复杂,每天产生海量监控数据,监控平台能够秒级将监控告警信息及时发出才能真正起到作用。
第二“剑”,变更管理。据统计,70%的IT故障是人为引起的,而人为故障基本上都是变更导致的故障。落实变更管理,变更操作方案化,变更步骤原子化,降低人为影响,不仅能提高工作效率,提升运维质量,还能提高运维人员的满意度。做好变更管理有四个要点:
(1)做好环境管控。不允许绕开4A登录,不允许不经过堡垒机跳转登录,隔离生产环境和开发测试环境。
(2)变更授权审计。所有变更必须通过审批,定期审计变更日志。
(3)变更自动化。变更原子化,能自动完成的变更加入例行作业排除人为干预。
(4)变更窗口管控。确定可变更窗口,非窗口期严禁执行常规变更,变更要按计划执行,提前或延后需提交审批。(www.chuimin.cn)
第三“剑”,故障管理。故障是一定会发生的,但故障是有方法进行管理的。故障管理包含六个环节:故障预防、快速定位、快速处理、原因分析、监控预警、应急预案。故障预防主要依靠主动预防式检查和趋势分析预测;快速定位需要依赖于常见问题标准分析流程、常见问题自动定位脚本、关联告警分析;快速处理首先要本着先恢复业务再修复根本问题的原则,形成各种故障快速处理准则;原因分析是要彻查每次故障发生根源,不让相同的故障多次产生相同的影响,需要提前部署收集主机、网络、存储、数据库、中间件等各方运行数据及日志,跨专业整体协调进行分析;监控预警是根据故障根源分析,对同类系统进行预查或打补丁,并将先发现的原子监控指标加入监控管理列表;应急预案是根据故障彻查分析情况,形成故障方案并进行故障处理模拟和演练,以防类似故障再次发生时,减少或规避对生产业务造成影响。
第四“剑”,备份管理。在大谈业务连续性管理的今天,其实很多金融企业还没有做好高可用管理,甚至是最基本的数据库备份管理。备份是数据库管理员的最后命脉,备份管理的核心是定期的数据库恢复演练,确保数据在需要的时候能够按时、按要求恢复出来为业务提供服务。做好备份管理之后,可以继续做容灾管理或应急管理,以及更高级别的业务连续性管理。这几类管理一脉相承的逻辑,是定期的“真实”演练,有计划的、频繁的演练才能保证业务连续性方案在需要的时候真正起作用。
第五“剑”,健康管理。数据库基线是健康管理的基础,从对象基线、安全基线、配置基线、性能基线、容量入手,定期分析数据库健康状况,并对异常情况专题分析,避免系统病入膏肓再切入处理。
第六“剑”,性能管理。越是重要越是繁忙的系统才越会被关注到性能问题。从以往的经验表明,数据库性能问题80%以上跟数据架构相关,其中包括物理模型和SQL语句。数据库性能管理一方面是堵,一方面是疏。“堵”是通过应用上线前的压力测试阶段将不符合规则要求的物理模型和SQL语句识别并由开发优化调整完毕才可以上线;“疏”则是通过对生产在线环境的物理表、索引和SQL语句进行定期探测,并进行优化改造。
通过对数据库的监控管理、变更管理、备份管理、故障管理、健康管理和性能管理,可以确保机房故障、人为故障发生时,数据库快速切换转移,继续对外提供服务。
有关2017年软件工程论文专集的文章
传统的企业运维认为,流程是企业IT的核心,不同的规范、监管要求,都是一再强调流程的建立、流程的管理和流程的优化。但事实上,离开了组织文化的熏陶,流程只是一个形式、一具躯壳,并不能有效驱动,达到企业想要的效果。组织文化要让运维人员觉得自己不仅仅是一个为了企业IT正常运转的螺丝钉,而是在服务企业的过程中,能实现员工的自我增值。图1组织文化是规范化运维的核心在整个组织文化层面,人无疑是最重要的。......
2023-10-21
这样一个变更操作是由13个标准原子步骤来完成的,其中备份文件的原子步骤是可以复用的。在不断对变更操作原子化进程的过程中,会逐渐积累标准的“原子”标准库,越来越多的变更操作就不需要去写原子步骤,而是调用即可。......
2023-10-21
建立了联片教研活动的导向机制和激励机制,把开展联片教研情况纳入学校教育教学工作年度责任考核、学校规范管理检查、校本教研示范校创建的工作指标内,确保联片教研的制度化和规范化。凉州区教育局先后2次被省教育部门评为“甘肃省教育科研先进单位”,获得“甘肃省普通高中新课程实验先进集体”。......
2023-11-07
智能运维与服务作为智能制造模式的一种,是主动预防型运维、全生命周期运维和集成系统运维在集中化、共享化、智慧化趋势下的集中体现,是构筑制造业服务生态系统的最终目标。智能运维与服务模式的内涵包括以下内容。智能运维与服务面临着海量的数据,如何对数据进行快速、精确处理与分析,决定着远程预警、检修和诊断的成败。图4-1智能运维服务模式本章介绍了智能运维与服务体系,实施运维与服务的技术基础,以及相关案例。......
2023-06-28
调查结果同时显示,综合管廊运维管理阶段的工作人员在调查中反馈BIM技术的可视化和数据集成功能有利于提高管廊运维效率,降低运维风险,减少运维成本。依托于BIM建立的可视化运维管理平台,实现综合管廊运维管理的精细化,相对于目前市场现有的综合管廊管理平台,更加适用于综合管廊的运维管理。......
2023-08-29
是曰“五运”(主运,甲为干首,故先土运。其运行自首丁壬木,每年木火土金水,各七十二日零五刻;运位相次,万年不易也。客运,如甲己年土运:土为初运,金为二运,水为三运,木为四运,火为五运,以相生序。如子年君火天、金地,则地左间太阳水,为初气;天右间厥阴木,为二气;司天君火,为三气;天左间太阴土,为四气;地右间少阳相火,为五气;司泉金,为六气。此每气六十度有奇者,万年不易之主气也。......
2023-11-01
谈到大数据安全时,数据和基础结构安全都很重要。除了与Hadoop类似的平台结构性安全问题,许多IT管理团队对其他数据管理平台的一般安全控制不足。根据所选NoSQL运营种类,很有可能提供一种或两种安全控制。设置或管理大数据集群时,集群管理人员应考虑以下各领域的安全控制。虽然Kerberos可极大提高安全性,也仍然需谨慎对待。通常安全控制包括API服务器中匹配令牌邀请、输入有效性检查、节点管理政策过滤、与目录服务的整合等。......
2023-11-16
然大同之义,虽见于《礼记》之《礼运》,实原于墨家。此种大同思想,儒家平日所未有,惟于墨家则甚合。大同之义虽与尚同不同,其名或与尚同有关。至《礼运》大同说之源于墨家,似无可疑矣。......
2023-11-26
相关推荐