企业运维的自我定位

2018-01-29 09:27:28 H3C   点击量: 评论 (0)
IT架构和IT业务的技术发展是运维发展的源动力和推手,所以运维的发展总是稍微滞后于IT技术进步的脚步。随着IT大集中、SDN、云计算、大...

    当今开源软件的数量和成熟度都越来越高,如果能够充分利用开源软件自己开发,无论从业务维度还是运维维度都是非常好的选择,但是这也同时提高了对运维人员的开发能力成熟度的要求。开发能力的成熟度,体现了运维人员的需求分析能力、框架设计能力、编码能力、开源软件熟悉程度、业务背景知识和对软件开发过程的理解能力。DevOps在运维界的流行说明了开发和运维的逐步融合,这无疑也是今后运维发展的趋势之一,然而在没有充分开发人力和敏捷过程储备的前提下,贸然选择DevOps(开发即运维)模式,有可能会面临巨大的风险。

    所以企业要看清自己所处的运维阶段、运维人员成熟度,选择更加务实的运维策略,寻求逐步改进,水到渠成的方式。

    运维的规模属性

    另一个需要关注的是规模属性,这里的规模包含设备(服务器和网络)、业务规模和运维人员规模。用户有50台服务器还是200台服务器、1000台服务器或上万台服务器对于运维来讲区别是很明显的。当设备数量比较少时,很多事件通过人工管理就可以了,但是随着被管理的设备数量的增加,运维工作量会直线上升,这时运维难度实际成指数级上升,再依赖人工运维几乎成为不可能完成的任务。规模运维必须依赖自动化监控工具、自动化配置工具、自动化部署工具和自动化流程工具来辅助实施。当运维规模进一步上升,传统运维就会演变成海量运维。海量运维不单纯是运维工具的变化,海量运维带来技术价值观的改变,技术手段的改变以及运营意识的改变,影响到深度运维方法论的变革。海量运维的变化归纳起来是分层(服务等级分层)、基于业务的合理取舍(CAP理论)、敏捷开发和务实运维概念的整合。下图总结了海量运维中的一些指导原则:


海量运维指导原则


                                                      图2.海量运维指导原则

    另一个影响运维的是运维人员的规模,如果运维人员在8个以内,就要慎重考虑是否需要复杂的运维流程建设。流程的设置解决了运维事件的闭环跟踪、责任认定和规范性等问题,但是如果企业运维人数很少,建立复杂的流程反而会降低运维的效率增加运维成本。但是如果企业运维人员数量超过20个,运维过程的规范性管理就重要起来,同时在运维人员的绩效管理方面也需要运维流程辅助,这时运维流程的重要性就凸显出来。但是随着时代的发展,自动化和智能化技术逐步普及,运维流程的发展趋势是越来越轻量化,ITIL完整流程体系的建设今后会越来越少。

    运维的位置属性

    最后再探讨一下运维的位置属性,这里的位置包含网络位置和逻辑位置。被运维对象所处网络位置大致可以分为接入网、广域网和数据中心。由于所处网络位置不同,这三部分的运维差异性非常大。前面讨论的大部分内容谈论的都是数据中心的运维,下面主要讲讲接入网运维。接入网运维涉及终端(类型、系统)、接入方式(无线、有线)、身份认证等方面,由于终端类型复杂,接入人员水平参差不齐,接入网运维的复杂度也比较高,运维人员不仅需要具备多方面的运维知识,还需要有足够的耐心,运维经验对接入网运维也非常关键。对于接入网运维固化的运维经验的专家系统是今后发展的方向。广域网运维相对要简单些,对于多数企业而言,广域网一般是租用为主,所以广域网运维主要是监控线路的时延、丢包、抖动和占用容量。

    运维的另一位置属性是运维的逻辑位置,随着云计算的普及,运维人员出现了分化,一部分是云建设方,另一部分是云的租户。云建设方的特点有点类似传统的运营商,重点关注的是资源(物理的和虚拟资源)的运行状况和利用率。云建设方同时需要考虑数据中心的成本控制以及风险控制。如何利用虚拟化和容器提升整体的资源利用率同时,保证业务风险在可控的范围内,以及如何及时回收由于云化带来的无效资源浪费的问题,都是云建设人员的重要考量。所以对于云建设人员而言,集群容量管理,数据中心容量,机房容量管理等多维度的容量管理在云运维中成为必备的需求。

    云租户没有资源的管理权,只有资源的使用权,所以租户更关注的是自己业务的运行情况和资源的占用容量信息。云租户负责运维操作系统以上的内容,关注重点是应用和业务的运行情况和资源的利用率。如何将众多的应用层基础监控数据规整成简单、直观的监测仪表盘,是租户运维工具的重要考量。另一方面租户管理员需要了解业务的资源占用情况和趋势,在必要时业务资源能否在成本可控的情况下得到及时扩展也是租户管理员关注的问题,所以业务容量管理对租户管理员而言也非常关键。

    当然还有相当多企业,没有租户的概念或者没有明确云建设方和云租户的地位,所有的运维工作由统一团队负责。这时云融合运维团队要兼顾上述两者的职责,既对业务负责又对资源和成本负责。

    总结

    前面介绍了运维的行业属性、成熟度属性、规模属性和位置属性,企业运维主管只有明确自身所处的位置、阶段才能确定自身运维的发展思路,跳跃式发展可能会付出额外的代价。运维体系正象自然界的生命一样在不断进化,长远来看,今后的数据中心一定是自运维的体系。但是要达成还需要很多的路要走,除了运维本身技术、工具的发展外也依赖于其他IT技术的支撑。希望读者看完本篇文章后能够向后迈好坚实的一步。

    名词解释:

    ITIL即IT基础架构库(Information Technology Infrastructure Library, ITIL,信息技术基础架构库) ITIL为企业的IT服务管理实践提供了一个客观、严谨、可量化的标准和规范。

    DevOps(英文Development和Operations的组合)是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保障(QA)部门之间的沟通、协作与整合。

    CMDB --Configuration Management Database 配置管理数据库。CMDB存储与管理企业IT架构中设备的各种配置信息,它与所有服务支持和服务交付流程都紧密相联。

大云网官方微信售电那点事儿
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
我要收藏
个赞