如何解决IT运维之痛?

日期:2017-05-27 10:47

IT运维体系是IT运维服务的基础和核心。通过IT运维体系的构建及完善,使我们的运维做到稳定可靠、准确完备和规范科学。


  

从人、事、物、流程这四个方面便可以很好地将IT运维体系进行解构,它们彼此互相作用,共同构建了一个完整实用的运维体系。下面列举了这四个方面各自的含义及相关内容。


  

1、人


  

例如完善岗位职责与职业发展、提高团队技术水平、完善技能分享与培训、完善团队绩效考核、规范工作行为规范等。目的是要建成一支工作高效、技术水平高、团结稳定、有职业素养的运维团队。


  

2、事


  

例如做好日常基础运维工作,保障好生产业务运行。不断探索新的运维理念与技术,探索优化系统架构。具体可以分为几大块,例如运维流程管理,资源架构规划,应急与故障处理,监控与优化,安全与防护,项目及日常工作等等。目的是要明白运维做什么正确的事,怎么正确地做事,做事有章法,稳定高效能。


  

3、物


  

主要是如何管理好系统运维所涉及的各种资源。例如机房环境、办公设备、服务器、网络设备、操作系统、应用软件、工具等各种软硬件资源。目的要使各类资源配置管理妥当,清楚资源属性,知道从哪来,现在哪,要去哪。使得物尽其用,物有所值,安置妥当。


  

4、流程标准


  

运用流程标准将上述要素(人、事、物)有机地结合,有序科学地流转、高效稳定地运行。例如资源规划与采购,各种标准规范、项目规范、软硬件配置部署规范、安全制度、工作交接等等。


  

通过实施IT运维自动化,能够很好贯穿人、事、物、流程标准。运维体系的好坏影响运维自动化的实施执行,反过来,运维自动化也会推动运维体系的建设。


  

面对成百上千的机器,人工手工运维显然是不现实的,这个时候就凸显自动化运维的优势了。


  

自动化运维分担了我们很多的工作压力,将重复、乏味的工作交给程序去做。既高效又避免人为错误,帮助我们科学有序的管理设备,系统及业务。


  

标准规范与自动化是当前主流运维成熟进阶的必经之路。流程标准很重要,必须要执行与持续完善,这是运维自动化以及公司运营一切的基础。看过复杂的航空线路图,航海线路图,铁路交通图吧!是不是会感叹标准化与自动化的重要性。运维工作也是一样的道理。


  

流程规范是最佳实践方法论,但不是目的。我们没必要纠结于高大全的标准与自动化,我们需要从我们运维需求出发,痛点出发,持续改进与解决运维实际问题。


  

1、工作繁琐:


  

采购设备软硬件,上架贴标签,系统环境软硬件部署,统计核实设备信息、复核系统变更情况,搬迁设备,调优系统……如此工作,日复一日,年复一年,会让人感觉无始无终。


  

2、鸭梨山大:


  

各种繁琐工作交织在一块,在有限时间、精力和繁重工作情况下,我们倍感鸭梨山大。尤其出现各种运维故障时,系统上线、调优、升级、恢复等特殊环境下,我们不仅仅是冷静地快速解决问题,还要面对背后一帮大佬的监察盘问……


  

3、设备系统故障:


  

设备系统,尤其是过保的硬件设备,很容易出故障。机房的温度,湿度,业务的读写频繁度,业务人员野蛮地使用,各种因素都会导致设备系统意外故障。意外就是意外,往往出现在不恰当的时间、地点。经常会让运维人员莫名郁闷。


  

4、熬夜加班:


  

有没有别人节假日团圆happy,你却在苦逼的加班熬夜。有没有别人吃喝畅聊时,你却在角落里苦逼的远程vpn操作,有没有三更半夜像特务一样起床打开电脑操作,低声细语的频繁打电话?有没有……?反正我都有……


  

5、IT消防员:


  

我们就是IT消防员,我们的最高境界就是无我境界,大家都很舒服时,都想不起来我。一旦想起来我,可能IT环境出问题了……我们只有硬着头皮去结尾,牺牲我一个,幸福一大家。


  

6、背黑锅:


  

IT运维人员有天生背黑锅的宿命。当你找不出别人的问题时,那就只能背黑锅,或许找出问题,也可能一起背黑锅。任何行业工作都有其委屈尴尬的一面,背黑锅是运维人员成熟历练的必经之路。


  

IT运维体系是运维的基础和核心。通过运维体系的构建及完善,使我们的运维做到稳定可靠、准确完备和规范科学。


     

怎么运用好自动化,提升运维水平:制度流程战略+自动化战术+工作责任心素质。


  

干IT运维工作,需要很多技能知识,十八班武艺样样都得会。精不精,修行在个人。


  

做IT运维工作,实施运维自动化,需要具有很多技术、管理、实践储备。


  

1、由开发主导运维自动化系统


  

通常由开发人员主导运维自动化系统研发,貌似顺理成章,但事实情况,很多开发人员可能并不了解运维工作情况,对运维架构体系并不清楚。开发人员他们开发的系统往往带有开发人员的很多主观意识。这就造成运维自动化系统并不很适合运维人员日常使用与维护。


  

2、由运维主导运维自动化系统


  

IT运维人员懂运维需求,是应该的,也是职业素养必须具备的。但运维人员往往不懂开发,甚至很多运维人员对shell/perl/python不熟悉,更别说开发一个系统了。自己不懂开发,那么在主导运维自动化系统中就会感觉坡脚乏力。