浅谈数据中心冗余技术的利与弊

2013-10-23 16:01:31 eNet硅谷动力  点击量: 评论 (0)
在这个信息高度发展的社会,企业对数据中心的依赖性越来越大。一旦数据中心出现故障,企业员工可能会无法正常工作、无法交易导致公司订单丢失、企业可能会失去大量的客户等等严重问题。根据META Group的统计,各
在这个信息高度发展的社会,企业对数据中心的依赖性越来越大。一旦数据中心出现故障,企业员工可能会无法正常工作、无法交易导致公司订单丢失、企业可能会失去大量的客户等等严重问题。根据META Group的统计,各行业平均每小时因为数据中心故障造成的损失高达$1,010,536.00美元。其中能源、通信、制造业的损失分列前三甲。具体情况详见下表:


表1:各行业数据中心故障损失统计表

  中国目前有将近54万个数据中心在运营,并正以每年18%的复合增长率高速增长,与数据中心相关的基础设施建设市场以达到千亿的规模。这么多的数据中心,几乎天天都会有大大小小的故障出现。可实际这么多的故障并没有造成多么严重的损失,这主要是因为几乎所有的数据中心都采用了各种冗余备份技术,从而当故障发生时,业务能及时切换到正常的运转层面,维持数据中心的正常运转。当排查完故障后,再将业务切回正常运转的层面。

  一般数据中心的故障来源有:硬件故障、软件故障、链路故障、电源/环境故障、资源利用问题、网络设计问题六个方面。减少这些故障的最简单方式就是冗余技术,可以通过对设备、链路、服务器提供冗余备份,从而将故障对用户业务的影响降低到最小。

  根据数据中心中业务的网络层级,可将冗余技术具体分为四大类:


表2:数据中心冗余技术

  ISO 4~7层冗余技术

  我们知道OSI协议参考模型定义了7层网络结构,其中四层以上都属于应用层,应用层具有区别各种高层应用和识别内容的能力。数据中心通过引入负载均衡技术,可对数据中心服务器群访问实现冗余备份,还可以完成网络加速,流量工程等一系列优化功能。数据中心可以采用两台负载均衡设备互为冗余备份。设备正常运行过程中可以手动同步配置信息和自动同步会话信息。当一台设备发生故障时,另一台设备可以快速感知设备故障,接管故障设备的业务,保证故障设备的当前业务不中断。

  网络层冗余技术

  数据中心可以引入网络级的关键设备冗余备份技术来减小宕机对整个系统的影响。RFC 3623定义了OSPF 的Graceful Restart标准,GR是网络设备主备切换时的协议冗余技术,GR冗余技术可以极大的缩短主备切换导致的路由中断时间。ECMP也是一种路由冗余技术,当路由的某条路径出现故障时,故障路径上的流量被重新分布到其他等价路径。EMCP有很好的收敛速度,在数据中心中,如果是基于纯IP架构,那么使用ECMP冗余技术是很好的一个选择。VRRP全称Virtual Router Redundancy Protocol(虚拟路由冗余协议),是一种网关冗余技术。VRRP可保证当主机的下一跳设备坏掉时,可以及时的由另一台设备来代替,从而保持通讯的连续性和可靠性。

  链路层冗余技术

  链路层的冗余技术主要有:服务器网卡冗余技术;链路聚合;环路监测;环路协议保护等技术。服务器网卡通过冗余技术可将多块网卡组合起来形成一个网卡组,网卡组内的网卡之间冗余备份,网卡组提供多种运行模式完成用户的不同需求。链路聚合Link aggregation是将两台设备间的数条物理链路“组合”成逻辑上的一条数据通路,提高链路的可用性,提高链路带宽。只要还存在能正常工作的成员,整个传输链路就不会失效,通过链路聚合实现了链路冗余。Loopback-detection工作在链路层。通过loopback-detection可以及时发现单端口环路,减小环路对数据中心的影响。STP、RRPP、RPR、TRILL等都是链路层的环路保护协议,通过这些协议可以实现链路的冗余备份。

  设备级冗余技术

  数据中心组网时一般会用到较多的设备。在实际运行过程中,各设备均面临着软件异常、硬件故障甚至外界影响(如:供电电路故障、自然灾祸)等各种意外的威胁。设备级的冗余设计可以通过关键部件冗余,灵活快速的故障侦测和恢复来尽量减小故障造成的影响。

  目前数据中心的设备多个硬件部件都是支持冗余备份的,比如设备的电源、业务板、风扇、主控板等等。当一个部件故障时,另外的部件马上可以工作,并且所有的硬件部件都支持带电插拔。除了硬件冗余技术,更主要的部分是软件冗余技术。IRF是一种网络设备虚拟化技术。通过IRF技术可以容许全局范围内的跨设备链路聚合,提供了全面的链路级冗余保护。同时IRF技术还实现了跨设备的三层路由冗余,可以支持多种单播路由协议、组播路由协议的分布式处理,实现了多种路由协议的冗余备份技术。目前很多设备也支持不中断业务升级的冗余备份技术,即ISSU,在设备正常运转的情况下就可以完成软件升级。软件冗余技术还包括支持设置主备两个启动文件。设备启动时可以根据优先级(主优于备)选择启动文件,在软件异常时启动备用软件。防火墙设备一般都支持HRP协议,这是实现在主备防火墙设备之间的软件冗余协议。

  以上简单介绍了数据中心各种常用的冗余技术,当然采用冗余技术的同时可能也会增加了网络的复杂度、增加了运营资金的投入。所以也不能一味的增加冗余设计,过于复杂的冗余设计反而会降低数据中心的可用性,增加数据中心的运营成本。数据中心究竟可采用哪种冗余技术,需要综合分析,结合自身业务运营的特点,合理地实施。

大云网官方微信售电那点事儿

责任编辑:和硕涵

免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
我要收藏
个赞