电力企业智能化IT运维管理的建立及应用

2016-05-13 13:45:47 大云网 投稿邮箱web@sgcio.com
关键字:电力  企业  
贵阳供电局迫切需要实现高效的、智能化的IT运维管理,以应对越来越多的资产设备和信息系统。

消除IT运行环境的监控盲点。我局建设了两个大型机房,但这两个机房的距离比较远,要保障机房的日常巡视就必须在两个机房都安排值班的人员,花费相当大的人力资源成本。机房维护质量依靠人力巡视、维护,取决于工作人员的技术水平、巡视到位率、细致程度、责任心和敏感性等。同时,以纸质记录的形式保存的人工巡视结果(如机房的温度、湿度、供电情况、服务器运行状态等)不利于记录的整理、保存,也不利于数据分析以整体把握机房环境的总体情况。工作人员依靠个人的经验判断潜在隐患,在排查上存在一定的滞后性。

提高对IT业务系统的监控质量。由于系统网络故障、瞬时负荷突增、服务器老化、厂商开发水平等等因素,业务系统不可能完全不发生故障。传统监控大多依赖系统管理员,靠他们巡视业务系统服务器和业务系统应用情况实现,业务监控的效果和效率和人的关系很大。要想在业务监控出现问题时及时预警,并及时发现、处理潜在的威胁以提升业务保障能力,就必须引入IT运维管理工具进行自动化预警管理,实现对信息系统自动巡警监控,从而提高业务系统监控的自动化水平,降低工作量、节约人力成本,降低人为因素的影响。

积累IT运维管理知识。贵阳供电局信息资产数量巨大,采用管理员更新电子台账的方式存在资产信息录入不规范、不完整的问题,致使信息资产台账纷繁凌乱、存放分散、准确性差,无法满足企业信息化发展和管理的要求。对服务器的管理很大程度上依赖于系统管理员的熟悉程度和工作经验,当管理员不在时,其他工作人员很难接手。随着企业信息化规模的扩大,网络和计算机设备的增加及管理精细化的要求,对于信息资产管理信息化、智能化的需求越来越大,企业需要引入IT运维管理工具对信息资产实现自动化管理,并通过基础资料的累积形成知识管理的基础,提高系统突发故障的处理效率。

完善IT运维人员的管理和监督机制。传统的IT运维管理方式对人的依赖程度很大,但在实际的工作中往往存在一些交叉性、边界性的工作,存在着一些“管不到”、“没人管”的问题,对人员的职责界定不清晰,没有明确的标尺衡量人员工作质量,缺乏有效的监督机制,在管理制度和监督机制上都存在一定程度的空白。

机房环境全方位集中监控

机房环境监控子系统通过安装不同类型的传感器,对机房环境的各个重要指标进行监测,并将数据传输到系统数据库中保存以备查找和数据分析。实现对机房设备环境(精密空调监控、UPS监控、温湿度监测、门禁管理、漏水监测、视频监控等)的集中监控,实现子模块之间的联动和包括语音预警及手机短信预警等各种形式的预警,实现机房环境的信息化、自动化监测及预警。如图1所示。

机房环境监控子系统提供声光、系统提示、固定电话、手机短信、E-mail等多种报警方式,保证警情及时送达,并可根据需要设定报警级别,在发现异常情况后对相应各级别的警情发送报警信息;系统还对分布在不同区域和设备的警情进行精确定位式报警,方便管理员准确了解发生警情的位置及状态,大大节约了人力成本。

机房环境监控子系统支持页面动态修改,即当监控系统正处于运行状态时也可对其页面或策略的各种对象属性进行在线维护,保证了监控信息的实时性和准确性。

  通过机房环境监控子系统的建设和使用,可以直接在WEB界面上查看机房运行的相关指标和参数,对分布在异地的多个机房实现集中监控和管理,实现机房24小时无人值守,及时预见和分析设备故障,及时发现、排除设备故障;有效降低设备损坏情况的发生,减少维修的时间和费用,降低潜在的风险和运营成本。通过机房视频监控模块实现了对出入机房的人员科学有效的监控和管理,增强机房的安全防范,提升了企业的管理形象。集中的