机房360首页
当前位置:首页 » 专家谈数据中心 » 季晓文:DCIM-构建云时代智能化数据中心

季晓文:DCIM-构建云时代智能化数据中心

来源:网界网 作者:Lily编辑 更新时间:2011/4/21 13:31:43

摘要:大家好,今天非常荣幸有这样的机会跟大家交流一下Emerson公司,我们在数据中心方面的一些想法和经验,我今天的内容偏重于管理方面的想法,因为在数据中心基础设施方面来讲,有很多很多东西值得交流。

  
特别是现在,假设我们现在不是做一个新的数据中心,我们在做一个旧的数据中心,非常重要的一点是在于挖掘。我们可以离开基础设施,虽然说这个东西比较底层,但是它的管理还是比较新颖的,我们走向IT的层面,我们到IT网管的层面,很多年以前,网管还比较新颖的时候,我们经常说我们的设备是可网管的,我们把这个概念放在基础设施里讲,我们会对旧的数据中心做挖掘,我的旧数据中心里组成的各个部件是可管理的吗?其实大多数都是可管理的,当你面对一个旧的数据中心,或者一个需要你进行调整的数据中心,第一步要做的事情就是把原先已经投资过的可管理的窗口或者界面挖掘出来,整合到你现在正在进行设计的新的管理平台里,这是非常重要的一步。

当然,这里面可能会有一些局限,这种局限在于你管理的深度和管理的广度。可以这样讲,对于一个存在的管理接口来讲的话,它决定了这个设备可管理,这个接口可吐出来的数据的颗粒度决定了你管理达到的深度,当然这对我们来讲采购一些智能的设备也是这样,你不用无限的购买非常非常智能的设备,首先你要决定你管理的广度和管理的深度,从这个层面再决定你要购买的设备基本功能不说,它的管理接口你根据你管理的需求决定你要购买的管理设备它的信息的颗粒度需要多少,如果你投入很多的话,你可以购买管理界面非常丰富的设备,如果你的管理需求不要那么深入的话,其实是一种浪费。

我们在大量大量的基础设施我们很少讲管理,我们大多数讲的是监控,其实在中国的词汇里“监控”是一个词,但是代表了两个含义,其实是三个含义,还有一个是隐藏的,“监”代表的是监测,你采集大量的数据,收集大量的数据,“控”代表给设备做一个反馈,调整它的运行状态,他们两者之间就是你的管理,你怎么根据收集上来的运行数据决定你控的策略。可以这样讲,对于我们现在的大多数用户来讲,绝大多数精力都放在监测,对控制完全是自发的或者是本能型的或者经验执行型的,比如我的机房温度过高,我的深度过大,或者我的空间不足,都是本能型的做一些手动的调整。

如果你是一个云的数据中心,你不可能依赖于你手工的方式。你要根据你收集上来的数据做出自动的判断,然后再加上一些预先设定的业务优先级的策略,混合在一起来决定你的控,这个控的过程也应该是自动的,这样你的响应速度才能足够快。也就意味着我们在监测的时候,其实决定了我们设备的数据信息量,控的时候我们决定这个设备是不是能接受我的自动的控制指令,这个过程我们需要消费我们收集上来的监测的数据,加上我们的知识库,然后形成我们控制指令的最终结果。这之间就是我们管理的最最核心的地方。

DCIM不是某一个厂商的概念,这是整个圈子里的共识,也就是数据中心基础设施管理的核心是帮助你形成你的业务决策,你购买了这个厂家的工具或者购买了那个厂家的解决方案,其实它的价值就在于它能够支撑你的业务决策。我经常会问一个问题,很多用户这样讲,我买了智能的PDU,我买了智能的配电柜,里面有大量的供电、配电、功率、功耗的大量的数据,有什么价值呢?如果你没有任何决策出来的话,其实它是零,它只是数据、只是信息,除非你能依据这些数据和信息形成你的业务调整或者优化的策略,然后把这些策略付诸于实际行动,它才能形成一个循环起来的价值链,所以,你购买大量智能的设备,根据没有任何的决策或者操作出来的话,其实没有意义。

回到前端我们还要回到第一点,数据,数据是很重要的,很多用户我有决策,但是他没有数据,其实等于零。所以,这两端都不可少。所以,在我们DCIM或者任何管理来讲,数据是基础。这些数据来自于哪里?很多地方。我们可以这样讲,来自于三个大类,第一个大类是你的工具、你的智能。第二个来自于你的IT设备,如果大家深入挖掘自己的IT资产,现在在所有的机箱里应该有类似于一个BMC芯片,它是单独的,独立在CPU之外,它能够侦测你机箱里物理的运行环境,甚至包括里面的电压,一些关键部件,一些机械部件运转的状态,这些信息都是你的基础设施的信息,有时候大家想我的服务器CPU的使用效率,这是你的IT,而不是你的基础设施。BMC收集来的信息隶属于你的基础设施的信息。这个要获取出来。第三很多的Sensor,传感器,这种传感器是对你前面的统称,这三大类信息要能够收集上来。

收集上来第二个问题在于数据的格式。很多时候我们觉得数据在那里就行,格式并不重要,但是如果你要统一的对这些数据进行处理的话,你必须有个统一的格式,否则你没有办法进行处理。这就是为什么在这个世界上,XML语言会变的那么流行。关于XML可以讨论很多很多场次和时间,但只是代表一种概念,也就是说数据的格式必须能够统一起来,否则的话,每个数据都局限在它自己的管理领域或者管理范畴里,也就是说谁能帮你做这件事情,我相信来自于Sensor的数据,来自BMC的数据,来自于空调、配电柜的数据都不一样,问题是你一定需要把这些数据都关联起来,放在一个统一的格式里,否则的话,你没有办法管理,我说的管理是统一管理,因为供电和智能是相关的,你的供电系统直接影响到服务器,你的制冷的效果直接影响服务器机箱的温度,特别对刀片高密度的信息来讲,但是他们各自表述的信息如果格式不一样,你没有办法把这些信息连贯起来的话,也没有办法做一个连续管理。所以,这非常重要。

第三,在管理的过程中,即使是在基础设施的管理当中,我们也可以参照很多(ITao)的经验,非常重要的一点就是有很多个管理的流程,在这个空间里,在这个管理平台里,是交织在一起的,比如在(I—T)里配置管理是所有管理的基础,因为它提供共享的信息平台或者信息标准,又比如说我们的安全管理应该贯穿在所有的流程里,安全管理不是一个单独的流程,所有流程里都有它的元素,它是贯穿所有流程的一个概念。又比如我们的问题管理和事件管理是相互的,因为事件管理里我们仅需要回避这个事件,我们不需要解决它根本的问题,在问题管理来讲的话,我们需要解决它的根本问题,这两者肯定是相互关联的,因为有了问题才有事件,有事件必定代表有一定的问题存在。其实意味着一个概念,我们在DCIM要投入的工作很大量,也就是我们有大量的工作要做,为各种各样的管理投入,他们之间是交互在一起的。

这想到一个问题,我们怎么投入,我们待会儿会讲。

另外一个问题,我们可以这样讲,购买用户特别是我们碰到的一些实际情况,任何您购买来的管理的平台,管理的工具,管理的解决方案不一定要和你的管理实践交叉在一起,你的组织架构能不能使用这种管理解决方案,你的管理流程能不能使用这种管理解决方案,我不相信你会为了一个管理解决方案调整你的组织架构,绝大多数用户没有这样一种定义的DCIM,IT还是IT的管理,IT的管理管到IT的设备,你不会因为今天我们所讲的DCIM就把你的组织结构进行调整,把设备和facility合在一起,上面的业务和IT有它的系统管理和网络管理承担。所以,每一个用户都有自己的组织架构和管理漏乘。

当你挑选和购买一个解决方案的时候,你必须了解这些,当一个厂商推荐解决方案的时候他也必须了解这些,否则他推荐的解决方案很难落地。

这张图是投资的图,刚才我们讲到DCIM里有太多的管理要做,但是他们又彼此交织在一起,意味着什么呢?你要达到一种平衡,某一个层面过多的投入产生不了你所假想的那种效果,你必须要达到一种平衡,你必须在安全、配置、事件、问题、流程、我说的是变更流程等等方面达到一个平衡,才能各自发挥各自的价值。比如你有一个很强大的配置管理系统,没有人用它,它的价值等等零,因为配置管理系统解决不了任何的问题。所以,您的投入其实要达到一种平衡,这样才会有效果。

对于艾默生来讲,我们这样想,原来的艾默生网络能源是一个为大家做设计,做建设的业务部门,它会为大家提供数据中心里全套的facility解决方案,建设的解决方案,当然它有能力为你做一个模型预估。但是对艾默生来讲,我们会运维的过程帮你做管理,提出一系列的管理的解决方案,当艾默生被收购之后,我们现在也是网络能源领域里的一分子,我们就会有能力帮你从设计、实施、运营,以及将来的优化,形成一个完整的循环。刚才我们讲到的数据采集、格式、决策,以及我们讲到的很多的流程,配置、变更、容量管理、事件管理、问题管理、优化等等都会在我们的解决方案里有所体现。所以,我们现在所设想的是一个真正的数据中心,当然是基础设施层面的一个完整的生命周期,在这里面来讲,我们是想让我们的解决方案在您的组织结构里,在您的管理过程中把它落地。

以上是我的介绍,谢谢大家。


  责任编辑:Lily

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/2011421/n481019645.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
转载声明:凡注明来源的文章其内容和图片均为网上转载,非商业用途,如有侵权请告知,会删除。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片