摘要:系统模块化是数据中心基础设施设计的重要理念和基本策略,数据中心设计建造中的很多问题都与系统模块化程度有关。模块化以及与之关系紧密的标准化,为数据中心带来了广泛的好处,它不仅简化了从初始规划到日常操作的每一个流程,还显著改进了数据中心商业价值的所有三个主要组成部分–可用性、适应性和总拥有成本。 |
一、可修复和可快速修复功能是提高系统可用性的关键
现代数据中心基础设施设计和运行的一个最基本也是最重要的要求是系统必须能连续工作。而工作连续性的程度通常是用系统的可用性来描述的。系统可用性A(t)的定义为:电子系统在使用过程中(尤其在不间断连续使用的条件下)可以正常使用的时间与总时间之比。可用性是由可靠性参数MTBF(平均无故障时间)和故障后平均修复时间参数MTTR表示的。
可靠性MTBF愈高,系统的可用性愈高,这是不言而喻的事,但设备的可靠性是有限的,特别是由若干不同功能不同厂家的设备组成的复杂的系统,可靠性很难达到设计要求的水平,使数据中心基础设施特别是供电系统变得很脆弱。于是,设计者和用户很自然的想到必须从系统的可修复和可快速修复上找出路,因为尽管系统和设备的可靠性达不到要求的高度,故障随时都可能发生,但只要系统中的所有设备故障后都是可修复并可快速修复的,故障后平均修复时间MTTR数值很小甚至趋近于零,那末系统的可用性同样可以很高。
可修复和可快速修复成为数据中心用户和设计者在系统设计时追求的首要目标。只要组成系统的所有具备独立功能的子系统,在系统投入运行后都是可拆卸、可移动、可更换的,那末这个系统必然是可修复的。
可快速修复通常指可无工具拆卸和可拔插更换子系统和设备。但是,如果功能相同的两个设备可冗余配置,当一个设备故障停止运行后,另一个与之冗余并机的设备可继续工作而保证系统正常运行,那末,对于整个系统而言,我们可以认为冗余并机环节没有发生造成系统宕机的故障,可靠性很高;也可以认为虽然设备发生故障,但是在修复过程中没有影响整个系统正常运行,修复时间为零。
以上设计理念已在数据中心基础设施用户和设计者中取得了最广泛的共识,并在系统方案设计和建造中取得了广泛的应用和显著的效果。
二、“系统模块化”是可修复和可快速修复的根本条件
我们把具有独立功能,在系统中可整体安装、拆卸、移动、更换的子系统称之为模块,那末上面的设计理念可概括为以下三句话:
1、现代的数据中心要求基础设施必须是一个能连续工作的系统;
2、一个能连续工作的系统必然是可修复和可快速修复的系统;
3、一个可修复和可快速修复的系统,组成该系统的所有子系统必然要具备模块化特征;
模块化即将完整的产品或流程按功能分成小块,即模块。根据上面讲的,模块的特征应该是:
模块是系统中一个具有独立功能和可独立运行的单元;
结构上可整体安装、拆卸、更换、移动;
相同单元可冗余并机运行;