机房360首页
当前位置:首页 » 专家谈数据中心 » 季晓文:DCIM-构建云时代智能化数据中心

季晓文:DCIM-构建云时代智能化数据中心

来源:网界网 作者:Lily编辑 更新时间:2011/4/21 13:31:43

摘要:大家好,今天非常荣幸有这样的机会跟大家交流一下Emerson公司,我们在数据中心方面的一些想法和经验,我今天的内容偏重于管理方面的想法,因为在数据中心基础设施方面来讲,有很多很多东西值得交流。

  我想跟大家交流的一点是关于数据中心基础设施方面定义的想法,原来定义有很多种,只是出于你的什么样的目的,原先我们是隔离开来,作为理念上不是怎么相关的东西看待。但是现在在云这样一个概念里来讲,我们会认为数据中心里面所有不可以浮动的东西都应该作为一个基础设施看待,我们可以借鉴前面微软关于集装箱式,很显然,集装箱过来,里面物理的服务器,物理的存储,物理的网络,以及它所有的制冷、供电都是作为一个完整的实体供给你的,而你的IT在接触到集装箱的时候,其实所有原先我们认为IT必要的部件都会分装在一个集装箱里,其实这个集装箱就是我们现在所定义的一个数据中心的基础设施,而你的IT的工作已经在这个层面上了。你已经拿到你想要的服务器网络以及存储。

因此,意味着我们更多的会把我们IT的设备和支撑IT设备的环境,以及构建这个环境的(Pce)作为一个完整的对象来考虑,并且考虑他们之间的管理,所以,这一点和我们原先在数据中心里是不太一样的。

数据中心从生命周期的角度来讲,我们从我们的设计,经过实施、运营,以及持续的优化,其实我会发现它是一个循环,这个循环来讲的话,原先在我们的数据中心建设过程中,或者说在长期的使用过程中并不是特别明显,但是随着数据中心越来越模块化,其实会办的非常的显现。在设计阶段来讲的话,作为基础设施本身来讲,它主要是考虑到IT的需求,在这里我们所谓的IT需求并不是具体到服务器的数量,因为在这时候我们所考虑的IT需求是指你所想要的运算的能力、网络交换的能力以及数据存储的能力,是从能力的层面来考验。因此,数据中心基础设施要有这个能力,当然这个能力的预估一般讲我们不可能预估十年,但是数据中心的存在应该是在15年到25年的时间考虑。但是我们预判IT的需求很难,一般来讲三年五年已经很了不起了,因为IT预判业务的需求可能一年到三年。

设计阶段之后你会进行实施,实施就是一个部署的过程,部署完成之后就是在运营。运营过程中其实要解决一个很大的问题,你运营过程的实际情况和你设计过程中所预想的情况是否能够吻合,如果这之间不吻合的话,意味着你需要去管理、调整,甚至需要做很多不同的东西。我们假设一下,如果你的实际情况和你的预想是完全一样的,基本上在这个层面你不用做更多的管理。但现在IT越来越复杂的东西不在于建设,往往在于管理过程,这方面投入的人力、物力已经超出了建设过程。

最后一个阶段构造优化,也就是说随着你的实际情况不断的调整,随着你的需求不断的调整,你需要优化,优化的结果其实是下一个模块的设计,也就是数据中心在不停的调整过程中,之后我们会具体的探讨。

从数据中心基础设施来讲,它来自于IT的五个需求,可能我们在这里来讲的话,不想走的太前沿,我们会具体讨论到供电、制冷、空间安防和布线,对IT设备本身的考虑,你所采购的IT的设备的标准必须统一,这些标准来讲的话,又反映到我们刚才所提炼的这五个物理的需求在这上面。所以说在设计阶段来讲的话,你要预估这几个方面,有一点客户可以想到,现在来讲,在他新建数据中心的时候,空间已经变成一个不那么重要的要素,更多的是考虑用电。但其实在用电程度上也隐含了对智能的需求。一般我们可以这样部署,90%的用电量转化成热量需要排走,是这样的一个估量。

运营过程中,IT的部署,不是你的基础设施的部署,而是在于你IT的部署,因为我们知道IT的部署,甚至于虚拟机的多少直接影响到你的整个IT的需求在不停的动态的变化。所以,很简单,对一台理想的服务器来讲的话,它对散热和供电的要求应该与它上面的运算量成正比,当然不可能,因为服务器在空转的时候,估计也不可能空转,里面至少要跑操作系统,裸机是没有意义的,可能至少也要耗掉30%左右,如果理想的话应该接近于零,但是不可能。越来越多的服务器厂商往这个方向迈进,在这里面呈一个线性的关系,这样你可以更有效的调整你的需求或者预判你在这几个层面的一些想法。

我们在管理的层面上来讲的话,非常重要的就是三个地方。第一个,一定要保证IT的可用。也就是说其实我们会这样讲,我们会把整个数据中心分成几个层面,最下面基础设施,上面是IT,IT上面是业务应用,每个层面和上个层面是消费的关系,或者你是提供一个服务,对你来讲,服务是否可用直接关系到你存在的必要性。所以,这永远是第一位的。在满足第一位的情况下,其实接下来就是两点,提升你的运营效率,降低运营成本。我个人是这样理解,对于云来讲的话,对所有的IT,特别是做IT运营来讲是一种威胁,当然也是一种机遇,因为当云的服务商能够提供相应的或者同一个等级的IT可用性的时候,它的效率或者它的运营成本大大优化于你的化,对所有企业你的内部IT来讲是一个很大的竞争。其实我觉得很多企业为什么会讨论私有云和公有云,其实有很大的政治因素,并没有很多的经济因素。

对于数据中心实施的运营过程来讲的话,其实我们会看到,我们把它分成几个阶段,第一部署,它自己的部署过程。第二是我的IT业务系统,我们会这样看待,其实对于任何一个系统上线,我们统称为业务上线,因为我们也跟很多的IT部门打交道,所有的IT人员都尽量的把自己也称之为一个业务部门,这没有错,因为对于任何一个业务构成,在数据中心里来讲的话有纯粹的业务逻辑以及IT层面,以及基础设施层面,所以我们所讲的系统上线会牵涉到所有的人,当然,对基础设施来讲也要保证这个上线过程。业务系统上线之后你就要提供你的服务,在最下面的层面提供你的服务,当然你的服务跟业务之间没有太多的直接关系,因为它当中毕竟隔了IT层面,但是你还是需要衡量你的调整,我们可以这样讲,你是不是有能力,因为我们知道数据中心有维护期、维护日,你已经预定义出来的维护的动作,你能否衡量或者评估自己的维护动作对业务产生的威胁。其实很难量化,大多数用户很难量化,特别是基础设施层面,因为它跟业务隔了相当的距离,所以,它很难量化,但是你应该量化,特别是突发事件出现的情况下,一旦你没有办法量化的话,灾难性的影响会很大,因为你没有办法衡量,所以,你就没有办法预估或者做一些准确的和精确的调整,这样你在这个层面往往有可能反应过激或者反应不足。

第四,持续到优化的层面。我们所面临的挑战可以看到非常重要的五点,第一点是我们存在的必要性,后面两点是我们在云时代能够继续生存的要素,怎么做到,通过下面管理的能力,进行维护和服务的能力来做到这几点,所以,这五点都有相互依托的关系。

我们再回到最初设计的阶段,其实看上去跟IT没有任何的关系,因为我们之间即使这样讲的话,Pfacility在设计的过程中,IT几乎不存在,只是一些它比较概要性的需求的一个定义在这里面,但是一旦当你运行起来之后,你会发现刚才我们在集装箱的同事也看到,一旦运行起来之后,就在于一个显示状况,这个图热力场或者气流场真实存在,它直接会影响你的可用性,你是否过热,你的供电是否足够等等这样一些,这是一个实际情况。你设想的气场图和实际的气场图是有差异的,如果没有差异,交付完一个数据中心就可以走人了,正是因为有差异,所以,才需要大量的人员对它进行管理。

我们尽可能使的现实和我们的设计之间的巨大差距缩小,当然不可能完全缩小,否则代表我的业务没有发展。到了差距无法缩小的情况下,你应该增加一个模块,这就是模块化的定义。可以这样讲,模块化一个数据中心建设起来不难,但是问题在于模块的边界你怎么去突破。其实我觉得对个人来讲,为什么集装箱型的数据中心和模块化的数据中心之间存在一个壁垒,这个壁垒就是如果你是集装箱型的数据中心,两个集装箱之间的壁垒是没有办法突破的,因为它是一个封闭的空间,但是如果你是模块化的话,它是灵活可调整的,其实他们两个会融二为一,这就是本质的差别。在这个差别里非常关键的一点,一是模块化,二是你的管理能力能不能使这个物理的壁垒突破开来。所以,在这个里面来讲,也就意味着我们要做到两点,你的管理能力能不能实现这种灵活的可调整的可适应的过程。其实他们之间是相互交织在一起的,你有能力做模块化也意味着你的管理能力能支撑到这一点。

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/2011421/n481019645.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
转载声明:凡注明来源的文章其内容和图片均为网上转载,非商业用途,如有侵权请告知,会删除。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片