数据中心自动化运维管理及平台的建设
摘要:运维自动化其实就是将传统的计算机运维工作实现自动化,从而改变了以往传统的手动模式,减少了运维工作人员的数量,全面的提升了计算机运维的工作效率。由于传统的单靠人工计算机运维已经不能满足当前企业服务器及数据量的各项要求,这就要求相关技术人员通过不断学习来应对目前高速发展的信息化时代。同时,对于企业的自动化运维管理系统在设计时要遵循自动化程度高、综合性强、易扩展的原则,从而在实际的工作时实现数据中心的自动化管理。
关键词:数据中心;自动化;运维;管理;建设
伴随着众多科研、从业人员夜以继日的深入研究,多项相关难题得到解决,“云计算”与“虚拟化”两项新兴科技逐渐得到了极大发展。为信息化构建带来了极大的便利,但也为数据中心的运维提出了全新的挑战。为此,提升数据中心运维技术,逐步实现数据中心运维管理的自动化,让相关运维技术人员有更多精力投入到对系统和技术的优化工作中,从而降低人工操作的失误率,节省人力物力的同时也给企业减少了众多的资金开支,使企业得以更加高效、便捷、低风险的稳固运行。
1自动化运维管理概述
计算机运维技术由来已久,在运维技术发展初期,仅有的几个服务器中所存有的数据信息极为有限,时至今日,信息技术的发展,为数据中心的建立奠定了基础,在此基础上,计算机运维技术也得到了很大程度的提高。研究人员根据用户需要,设计出与之相适应的管理软件,从而实现了有人参与下的数据中心自动化运维管理。自动化运维的实现,大大减小了传统人工运维管理下的时间延迟,将人们从反复性的工作中出来,大大提高了
工作效率。不仅如此,基于计算软件技术的自动化运维系统还可以实现自我状态监控,对运维管理中的各种风险进行预估,并根据软件中阈值设置的大小发布预警信息,从而降低自动化运维过程中存在的风险,减少因自动化运维风险导致的成本支出。
2自动化运维管理需要实现的功能
2.1自动监控功能
随着自动化运维管理的不断普及,以及自动化运维系统的扩大,运维人员在数量上已经无法满足日常管理需要,以至于不能及时发现其中存在的风险,进而导致较为严重的后果。因此,实现自动化运维的自动监控功能,有利于通过数据分析,对相关运行风险进行评估,并将评估结果上报计算机管理员,以及时提出应对措施。
2.2自动检测配置变更功能
在实际运维工作中,由于工作量的增加,导致在软件配置方面极易发生遗漏现象,因此,自动检测配置变更功能的实现,能够使运维人员通过远程控制的方式,检查对应软件的配置信息是否与约定配置相同,若不相同,则需要通过远程配置的方式,对软件中的配置进行变更,与此同时,触发自动化运维变更流程。
2.3自动提示功能
运维工作是一项极为复杂的工作,对运维人员有着极高的要求,在运维管理工作中,自动化运维平台需要对任务类型进行分类,并严格按照流程执行相关任务。但是,在实际应用中,自动化运维平台出现故障的几率较高,一旦出现故障,自动化运维平台将向运维
工作人员发出告警信息,并为工作人员解决故障提供指导。
3自动化运维平台建设的主要内容
3.1构建自动化运维管理平台
自动化运维管理平台是数据中心自动化运维平台的核心,通过自动化运维管理平台,能够实现对数据中心自动化运维平台所存在的风险提出预警,并对其中出现的故障进行快速恢复。在自动化运维管理平台的构建中,需要借助服务端、数据库、互联网、计算机等技术,实现对数据中心海量数据的监控,通过科学的数据分析,对自动化运维风险进行评估,同时给出降低自动化运维风险的建议。
3.2构建数据中心自动化运维平台的故障触发流程
故障触法流程,是指在自动化运维平台出现故障之后,系统将自动对故障信息进行汇总,并启动上报流程,将汇总后的故障信息发送至相关人员,并对这一故障将产生的风险进行预估,为运维人员后期故障的排查、处理提供依据,提高自动化运维平台的故障处理效率。
3.3设计完善的事件跟踪流
自动化运维平台的实现,是基于软件对参数分析后的自我判断,在软件判断行为做出之前,需要对数据库中的信息进行比对,从而确保自动化操作的正确性。为实现的对自动化运维平台工作情况的监督,自动化运维平台的建设过程中,应当设计完善的事件跟踪流,从而明确自动化运维平台所发出的每一项指令,减少运维工作人员对系统的随意操作,避
免不必要的风险与故障出现。
4数据中心自动化运维平台的设计目标
4.1指导性
为避免人为因素导致的各种风险,数据中心自动化运维平台的设计应当具有一定的指导性,利用计算机软件技术在数据处理方面的优势,通过科学的分析,对风险进行评估,为运维管理工作提供依据,从而提高自动化运维平台的安全性,降低平台运营风险。
4.2实时性
自动化运维平台的相关工作均以数据流的形式进行展现,因此,为保证自动化运维平台的工作效率,数据的实时传输就是必要条件之一。数据传输的实时性,能够使运维人员在第一时间掌握自动化运维平台的工作状态,并根据数据分析的结合,对可能存在的风险进行防范。
4.3可靠性
数据中心自动化运维管理平台建设的目的是实现以数据为参考的自动化运营和维护,因此,数据的可靠性就显得至关重要。因此,在自动化运维中心的设计过程中,需要增加数据监控、对比、分析的功能,保证数据的真实、有效。
5数据中心自动化运维平台功能的实现
5.1基于本地数据库与异地数据库的同步监控
在自动化运维管理工作中,以本地数据库和异地数据库之间的数据监控的同步进行为核心,从而实现对应数据的精准复制,确保数据中心安全。在缺少自动化运维技术的情况下,该工作只能由人工完成,通过对源端和目标端之间数据状态进行检查,从而完成相应的数据处理工作,这大大加重了运维工作人员的工作量,其效率也明显偏低。为此,技术人员通过编写程序的方式,在本地服务器上运行Shell脚本,并通过互联网将数据信息传输至自动化运维平台的数据库中,提高了数据的有效性,还可以更加及时对故障进行预警,并将故障点在自动化运营平台上显示。
5.2应用服务与数据库服务可用性监控
作为运维人员的评估项目,应用服务状态与数据库服务状态建设关系到、企业和高校的正常运营。在缺少自动化运维平台的情况下,相关风险不能提前预警,具有不同程度的滞后性,从而大大降低了相关工作效率。在自动化运维管理平台的基础上,通过对应用服务与数据库服务的实时监控,将大量数据传送至自动化运维管理平台的前端,运维人员借助软件对相关数据进行分析,从而大大加快了数据分析的速度与准确度。在此过程中,一旦发现存在风险的数据信息,则会由自动化运维管理平台进行预警,从而弥补了传统人工运维过程中故障处理的滞后性。
6结束语
大数据时代的到来,使、企业、高校工作的信息化程度不断加深,以数据中心为代表的新技术为、企业、高校等各项工作的开展带来了极大便利。加快数据中心自动化运维管理建设,是降低数据中心管理过程中人为因素导致的故障,减少运维管理成本,提高管理效率,实现真正意义上自动化管理的必然选择。
参考文献:
[1]朱玉立,任义廷.浅谈大数据时代下的数据中心运维管理[J].信息系统工程,2015(11).
[2]蒋飘蓬.基于云计算的数据中心服务架构研究与实践[J].电脑知识与技术,2017(22).
[3]王维沂.现代企业数据中心运维管理[J].商,2015(14).
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- sceh.cn 版权所有 湘ICP备2023017654号-4
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务