机房360首页
当前位置:首页 » 供配电 » 现代数据中心供电系统设计理念的变化

现代数据中心供电系统设计理念的变化

《现代数据中心供电系统规划设计》第二篇

来源:机房360 作者:陈冀生 张广明 更新时间:2013-5-3 10:56:46

摘要:在数据中心中,供电系统是基础设施最重要子系统之一,本文将针对现代数据中心供电系统设计理念的变化进行全面系统的介绍和讨论。

  2.2 对系统可靠性的研究向可用性研究变化

  当代数据中心对供电系统的连续性提出了非常高的要求,厂商和用户已经形成这样一个共识:供电设备经过多年发展,在其性能指标已完全满足IT网络设备要求的情况下,真正能为用户带来价值的是其可用性。可用性在概念上它包含了系统中设备的可靠性、可管理性和可维护性。可用性定义为:系统在使用过程中,可以正常使用的时间与总时间之比。可用平均无故障工作时间MTBF和平均修复时间MTTR表示,可用性A(t)= MTBF/(MTBF+MTTR)。

  从可用性定义和表达式来看,提高系统可用性的措施不外乎两种,一是提高可靠性MTBF,二是降低故障后的修复时间MTTR。由下面的分析可以看出,这两种方法对提高系统可用性的作用有着明显的差别。

  2.2.1 提高设备可靠性对提高系统可用性的局限性

  根据可用性的定义,提高设备的MTBF即可提高可用性,当MTBF达到一定数据时,可用性就趋近于1,也就是说,设备永远不发生故障,系统可用性自然就是1。但实际情况是不可能的。提高设备可靠性是在产品生产阶段完成的,包括采用先进电路技术、可靠性电路设计、提高智能管理功能、可靠性热设计、电磁兼容性设计、生产工艺流程管理、产品测试等。

  这些生产过程的严格执行可使产品的可靠性达到预期的水平,但是要使可靠性进一步提高以达到数据中心的要求,难度很大而效果是有限的。以UPS设备为例,组成UPS主机的上千个元器件和几千个接点,在可靠性等效图上是串连的,可靠性科学指出,链的强度取决于最薄热的环节。整个系统的可靠性是这上千个元器件和几千个接点可靠性的乘积,所以,要进一步提高整机的可靠性,就必然要求组成整机的所有元器件的可靠性都有相应的提高。因为受到元件部件工艺和技术革新和发展的限制,做为整机厂家,单靠电路技术和生产流程管理是做不到的。即使能有所提高,效果也是很有限的。

  2.2.2 降低修复时间对提高系统可用性的特殊作用

  前面讲到,设备的可靠性是有限的,特别是由若干不同功能不同厂家的设备组成的复杂的系统,可靠性很难达到设计要求的水平,使数据中心基础设施特别是供电系统变得很脆弱。于是,设计者和用户很自然的想到必须从系统的可修复和可快速修复上找出路,因为尽管系统和设备的可靠性达不到要求的高度,故障随时都可能发生,但只要系统中的所有设备故障后都是可修复并可快速修复的,故障后平均修复时间MTTR数值很小甚至趋近于零,那末系统的可用性同样可以很高。

  图2.1和图2.2显示了MTTR如何影响系统可用性,以及这种影响的重要性。

  从图2.1及图2.2可看出平均维修时间MTTR对提高系统可用性A的作用远大于平均故障时间MTBF的作用。

  ① MTTR对提高可用性A的作用是提高MTBF根本达不到的

  就当前的UPS技术水平而言,UPS设备的MTBF值在10万小时左右,而平均维修时间(从故障开始,到厂商反应,直到修复完好后重新启动),典型的时间是8小时,在此情况下,系统的不可用性 =0.00008,即可用性A为99.992%,年宕机时间为0.7小时。但是,如果用模块化热插拔功能可把MTTR降到0.5小时,同样在MTBF=10万小时的情况下,不可用性 可降至0.000005,系统可用性A高达99.9995%,年宕机时间仅为0.044小时。反之,如果MTTR为8小时,当要求可用性A达到99.9995%时,则要求UPS设备的MTBF值达到159万h,这对单台UPS设备而言是个不可想像的天文数字。

  ② 提高MTBF值对可用性A的提高并不是总有效的

  从图2.1可以看出,MTBF值与不可用性 并非线性关系,MTBF值较小而MTTR值较大时,提高MTBF值时对降低系统的不可用性的作用较明显;MTBF值已经比较大而MTTR值又比较小,再努力提高设备的MTBF值,对降低不可用性的作用就微乎其微了。例如:

  MTTR=16h,MTBF>300 000h,提高MTBF值的作用就不明显了;

  MTTR=8h,MTBF>160 000h, 提高MTBF值的作用就不明显了;

  MTTR=4h,MTBF>140 000h, 提高MTBF值的作用就不明显了;

  MTTR=2h,MTBF>100 000h, 提高MTBF值的作用就不明显了;

  MTTR<0.5h,MTBF>50 000h,提高MTBF值的作用就不明显了。

  2.2.3 对可用性的研究极大地促进了供电系统配置方案和供电设备性能的技术进步

  可用性研究的内容包括:

  ·系统可修复和可快速修复设计;

  ·设备和系统的冗余可容错技术;

  ·设备的模块化可在线热插拔维护和扩容技术;

  ·系统的集成一体化技术;

  ·智能管理和与IT系统无缝集成的通讯管理技术等。

  冗余容错技术和系统模块化设计成为数据中心供电系统设计关注的焦点,设备的冗余并机技术可认为提高了可靠性(没有影响到关键负载的供电),也可以认为把设备故障修复时间降到了最小(没有因故障修复而影响到关键负载的供电)。而系统模块化技术则是极大的降低了故障修复时间。最典型的是模块化UPS,它同时具备了冗余容错和快速修复两种功能(见本篇2.5)。

本文地址:http://www.jifang360.com/news/201353/n739747510.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
更多
推荐图片