云计算环境下“容灾新思路”

2014-09-01 13:53:20 大云网  点击量: 评论 (0)
2013年11月22日晚间,在云电科技园的信息中心办公楼里,一场营销管理信息系统容灾应急演练正式举行,演练真实模拟了云南电网公司营销管理信息系统在云电科技园生产环境数据库、存储设备不可用,短时间内无法恢复
2013年11月22日晚间,在云电科技园的信息中心办公楼里,一场营销管理信息系统容灾应急演练正式举行,演练真实模拟了云南电网公司营销管理信息系统在云电科技园生产环境数据库、存储设备不可用,短时间内无法恢复,公司应急指挥中心迅速启动营销管理信息系统(云南电网公司营销3.0系统)容灾切换应急预案,将业务切换至电力大厦容灾环境运行,并达到了信息系统应急演练的预期效果。
随着云南电网业务的快速发展,各业务运作更加依赖于信息系统的稳定运行,但是一旦发生大的灾害,云南电网公司的IT系统及其所支持的业务系统将毁于一旦。为避免重大灾难发生时信息系统出现瘫痪、用户资料、运营数据的丢失,云南电网公司早在2009年8月就建成重要信息容灾备份系统,2011年11月成功开展容灾切换演练,自此,容灾应急演练被列为云南电网公司年度信息系统运维的重要工作。
容灾系统现状
云南电网公司信息容灾按照“平战结合、应用双活”的建设思路,利用存储和数据库复制技术,以电力大厦数据中心和科技园数据中心为基础,建设了包含营销、生产、财务、办公自动化等16个业务系统的同城应用级容灾系统。其中营销系统实现应用双活,生产管理系统实现统计类报表查询的分离,实现灾备资源的最大化利用。
整个容灾系统涉及的存储系统、备份系统、高性能计算主机、刀片服务器、数据库复制软件五个子系统,通过系统整合,业务迁移,逐步形成生产中心和同城容灾中心的系统架构。在生产中心,将核心业务数据库整合到新购的高端主机上,并且将原数据库服务器改造为应用服务器,把原应用服务器改造为同城容灾中心的应用服务器。生产中心配置完整的接入平台、应用处理平台和存储平台;同城容灾中心配置相应的接入平台、关键业务的应用处理平台和存储平台。(见图一所示)
整个系统使用SRDF、VVR、 GoldenGate等多种技术实现数据复制,使用容灾导航软件配合业务切换脚本实施容灾切换,两个中心间可实现业务系统整体切换和单一业务系统切换。项目建设完成后,全面提高了云南电网信息系统的安全系数以及业务的服务质量,提高了企业应对灾难的应变能力。
云计算技术对容灾系统产生的变革
云南电网公司2012年实施的云计算试点建设项目,主要完成了云计算Iaas层资源的建设,项目的工作内容主要完成计算(小型机和X86服务器)资源池、存储资源池、网络资源池、桌面资源池的建设以及云管理平台(云资源管理系统)的开发与部署。
通过项目建设,将云南电网数据中心原来各种物理分散,系统异构的服务器、存储设备等实现了逻辑集中,资源复用和弹性计算。通过项目实施将原有物理资源进行整合转变为逻辑资源,打破了底层硬件设备物理结构上的壁垒,形成统一的资源池,以虚拟化技术兼容已有应用,在存储层和主机层实现了资源复用,极大的提高设备利用效率,在实现绿色节能的同时使得整个信息系统的系统容量、系统的可靠性得到飞跃性提高。同时通过云计算管理系统的研发和应用,打破了传统的“竖井式”管理,形成一体化的IT运维与管理模式,系统维护人员的效率大大提高,极大加强了IT管理组织建设与IT管理水平,最终使全面的“服务”导向型IT信息化目标得以实现。另外通过云计算技术的基础设施试点建设项目的实施,为未来云计算PaaS层和SaaS层相关建设奠定基础。
云计算助力容灾建设
通过云计算试点建设,我们体会到未来云计算数据中心必将通过技术升级替代传统数据中心,云计算技术的应用必然对容灾系统的建设产生重大影响,特别是虚拟化技术及分布式技术的引入原有容灾系统需要进行相应的改造。
相对数据容灾来说云计算是一种新兴技术,云计算工作模式和设计理念和传统模式有较大的差异,从技术上来说云计算技术打破了原有数据中心间的资源分割,通过网络将分布在不同地点的计算和存储资源提供给应用系统使用,云中的每一个数据中心即是生产数据中心也是容灾数据中心,应用系统的业务的连续性都得到了极大的加强,简化了传统的数据中心容灾方式,降低了传统的数据中心容灾的难度。云计算虚拟化技术的引入对容灾系统的建设带来很多新方法,例如通过网络层虚拟化技术可以将多个数据中心间打通形成一个逻辑上唯一的虚拟数据中心;虚拟化服务器资源池不再受到二层网络的限制,只要拥有足够的网络带宽当服务器出现故障时,虚拟机可以快速的迁移到其它数据中心正常运行的物理服务器上继续运行;另外随着存储虚拟化技术引入,存储设备上的数据容灾也可被“虚拟化”,与传统方式比较这种容灾方式更为灵活,首先数据复制不再依靠SAN网络而是通过IP网络;其次通过存储虚拟化技术可以在生产端和容灾端形成两个包含异构存储的资源池,数据复制不再局限于配对的高端存储设备,而是资源池里的任一设备,因此用户可以用更低的投资在容灾中心建立完整的热备份数据或者温备份数据。
另外当前在互联网行业中广泛使用的分布式存储、分布式数据库和分布式计算等分布式技术,本身就具备高安全性和高可靠性的容灾能力,在这些系统中服务器和存储设备可能相距几百、甚至上万公里,系统的容错机制保障了当出现一个甚至多台设备出现故障时不会丢失任何数据或者导致应用的中断。未来随着这类新技术逐渐成熟,开发运维难度的降低,投资成本也逐渐降低,企业用户将逐步利用云计算技术实现更高级别的容灾。
容灾系统的建设目的是在灾难发生时提供一套备用的系统来保持业务的持续性,并在需要时恢复相关数据。通常容灾系统系统的建设根据技术实现模式,建设的难易程度和对系统的保护程度,有本地数据备份、同城数据级容灾、同城应用级容灾、远程数据备份和异地数据容灾等多种方式。根据统计系统灾难有20%的故障是由于地震、台风、恐怖活动、战争等引起的,在这类大规模灾害发生时显然同城容灾系统无法为信息系统提供足够容灾保护,因此为了防范于未然,云南电网公司在利用云计算技术对同城容灾系统不断完善的同时,还要逐步开展异地容灾系统的建设工作。(作者:胡永华   张羿   白枫   耿贞伟)
大云网官方微信售电那点事儿

责任编辑:叶雨田

免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
我要收藏
个赞