机房360首页
当前位置:首页 » 数据中心资讯 » 大规模数据中心自动化运维实践

大规模数据中心自动化运维实践

来源:机房360 作者:机房360 更新时间:2016-5-14 22:20:55

摘要:“三分靠技术、七分靠管理”,对于大规模的数据中心,如何才能高效的运营、维护?如何才能在将运维成本降到最低的同时,保证业务的稳定运行?

机房设计

  图4 机房设计

  还有上两图的这种设计,机房有抬高层,散热系统在下面;每个机柜都是封闭的,有自己的门和锁,安全性高;机柜的冷风通过通道直接进入机柜中,而且可以单独开关(如上图红线标示处),不仅节能而且散热效果好,但是上半部分设备的散热效果可能会差一些。

新的机房很多采用微模块化设计

  图5 新的机房很多采用微模块化设计

  现在新的机房很多采用微模块化设计,这种设计降低了对机房本身的要求,不需要抬高层,封闭的散热系统,规范化的走线槽,将节能、美观、高效有机的结合起来。

  数据中心的等级划分

  目前比较流行的数据中心等级划分是根据美国ANSI&TIA-942数据中心通讯网络基础设施标准设定的,分为如下4个等级:

  等级Tier I ――基本数据中心

  等级Tier II ――基础设施部件冗余

  等级Tier III ――基础设施同时可维修

  等级Tier IV ――基础设施故障容错

  其中Tier IV等级最高,不管是国内还是国外,这种等级的数据中心都不多,目前国内大部分数据中心都是Tier III的。不同等级的具体区分,在这里不赘述,有兴趣的朋友可以上网查一下。

  运维的定义

  运维的定义,我在维基百科并没有找到,不知道这个是太容易理解了,还是太难于定义了。

  我不敢妄加定义运维,只是说说我自己的理解。我曾经认为,运维更多的算是产品或者一个系统交付生产后,到这个产品/系统的生命周期结束前这段时间所做的工作。但是现在IT行业发展的趋势及DevOps的流行,对运维人员的要求越来越高,需要更早的参与到整个生命周期里去。

  以数据中心的运维举例,运维人员可能需要从数据中心选型就参与进来,包括选址,选择网络提供商,考察数据中心各种设施及服务等,而不是说等这些定了之后,上了生产才开始运维。

  另外,我需要明确一点,今天我们谈到数据中心的运维,并不是简单的从数据中心提供商角度出发,还包括数据中心使用者的角度。

  青云QingCloud目前使用了多家数据中心的服务,我们也在考察、建立自己的数据中心。

  数据中心的运维

  现在正式进入今天的主题——数据中心的运维。

  数据中心的“风火水电”

  说到数据中心的运维,经常会提到“风火水电”。

  ·风,通常指空调制冷及通风过滤系统。干净的空气能延长设备的寿命,减少故障率。不考虑报废时间,同样的机器在北京运行和在芬兰运行,寿命和故障率都会有很大差异。

  ·火,一般指消防。这个是常常被人忽略的一部分,但也经常是最致命的一部分,一旦发生火灾,可能整个地方都需要停电,且短时间内难以恢复。

  ·水,通常是湿度及防潮。湿度过高,可能会影响设备寿命;太过干燥又会导致静电,有可能损坏设备。

  ·电,机房电力。电力被认为传统数据中心的重中之重,没有电力,数据中心就是空壳,而且数据中心的电力需要保证稳定,且是多路备份。

  上面提到了“风火水电”,其实还应该再加上一个“网”,数据中心必须保证有高效的网络,离骨干网应该尽量的近,而且需要能提供BGP线路服务,这也是很多客户选择数据中心的一个重要评判标准。

  数据中心的选择

  数据中心的选择标准可以归类到下面三点:位置,主要标准和次要标准。我们提到的标准是站在不同角色进行考虑,包括数据中心建造者与使用者。

  ·位置,包括数据中心所在的城市及区域,这将直接影响到预算,至少要避免受到天津大爆炸那类事故的影响;还会影响到你是否能招到合适的员工;需要考虑出现故障时的响应速度等。

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/2016514/n455581977.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片