机房360首页
当前位置:首页 » 专家谈数据中心 » 美国数据中心能耗——绿色的进步和挑战

美国数据中心能耗——绿色的进步和挑战

来源:机房360 作者:汪刚 更新时间:2016-10-19 17:26:07

摘要:今日,“TGG(中国)2016年高峰论坛”在京召开,TGG(中国)理事长,微软-数据中心战略规划-首席基础设施工程师汪刚博士在会上做主题为“题目”的演讲。

  今日,“TGG(中国)2016年高峰论坛”在京召开,TGG(中国)理事长,微软-数据中心战略规划-首席基础设施工程师汪刚博士在会上做主题为“美国数据中心能耗——绿色的进步和挑战”的演讲。以下是演讲实录:

  今天和大家分享一个信息,美国能源部今年发布的一个对美国数据中心行业能耗进行全面评测和进行分析,回顾了过去也对将来做了一个展望。大家可以看到数据中心第一耗电量非常大,第二我们已经做了很多的努力,把数据中心的能耗控制在了一个可持续性的范围之内。当然如果大家看一个绝对的数值,这个数值还是很大的。

  TGG(中国)理事长,微软-数据中心战略规划-首席基础设施工程师,汪刚博士

  在2006年的时候,美国也做了一个同样的全国性的评测,把数据中心整个的能耗做了一个评测,2006年全年用于数据中心的电耗是610亿度电。在那个时间段他做了一个预测,如果说按照现在这样的发展趋势,十年以后会是怎么样,如果说我在技术上进行改进以后又是怎么样。右边的虚线是在各种场景下,他在预测说今后会是怎么样的,已经过了十年了,我们来看看现在又是怎么样的。这十年中发生了什么样的变化,我们目前所经历的又是什么样的,这些数字是什么,90%,我们现在仍为所有数据的90%是在两年之内积累的,从人类有记录开始到2014年,只不过是我们所有数据量的10%。0.5%是我们现在所收集的所有的数据里面,只有0.5%我们进行了初步的分析,如果把这0.5%增加到1%或者10%,我们需要的计算量需要增加多少,我们需要的数据中心又是多少,我们需要的能耗又会是多少。谷歌搜索,每秒钟全球谷歌搜索55000条,如果你在谷歌搜索里面打进去,我们现在所有的数据量有多少,它在0.4秒钟之内可以给你回复出11亿条信息,速度之快,搜索的范围之广,这里面的计算量、存储量、数据中心数量、功耗能耗,大家可想而知。每天我们全球所产生的邮件,每秒钟250万条,4亿是什么,如果说现在大家都在讲的很热闹的东西IoT物联网,如果说预测到2020年,按照目前的设想,我们所有的物联网,把物联网所采集到的数据,需要进行我们所预想到的可以分析的手段,全球需要4亿台服务器,4亿台服务器很粗略估算一下,就是1万亿度电,刚才看到2006年是610亿度电,到了那个时候,你需要1万亿度电,我们整个的供电,我们整个的能源是不是能够支撑这样一个物联网的需求,所以面对整个行业的挑战是非常巨大的。云计算的发展,公有云整个全年的大家花费在上面的费用,五年之内会增加一倍多。这个就给大家一个概念,数据中心从2006年在美国的数据中心作为一个基准点,我们已经经历了十年了,我们还要往前走,我们所面临的挑战是非常巨大的。

  今年出版了第二次美国能源部对全美的数据中心行业能耗的分析,拿2014年做一个截止点,2006年是610亿度电,2014年是700亿度电,这个增长,刚才讲到我们需求的增长非常快,但是数据中心的能耗在美国这样一个地域范围里面增长是相当有限,增长的幅度大家可以看一下,从2000年到2006年增长90%,然后慢慢减缓,最近从2010年到2014年只增长了4%,我们预计在今后的四年时间我们还能保持在4%的增长,是根据我们对需求的预测以及我们所能够采用的技术,当然这个路还是很长,现在整个IT行业的发展变化的速度很快,这个里面有很多的不确定因素,所以我们不能满足于数据中心能耗只增长4%。怎么样才能够让我们从原来的610亿度电到今天这样700亿度,再按照4%的增长,需要各个技术领域、各个层面有创新,需要有节能的措施。大家可以看到各种各样的虚线代表了不同的场景下你的技术的革新步伐有多快,服务器也好,网络也好,基础设施也好,都会有不同的变化。如果我们对未来预测基本准确,也许我们会按4%的增长率到全美数据中心总能耗700亿度电,如果说按照最理想的节能技术发展的情况,我们是有可能把能耗控制在更低的水准。

  讲回到PUE,这个报告里说了,PUE在不同的数据中心规模里会是怎样的情况,超大规模的数据中心的PUE明显要比企业级的或者其他的数据中心要高一筹,比如网上的公开信息表示微软、谷歌,Facebook的PUE都达到了1.07、1.06这样的水平。从服务器占比,在企业级数据中心还是超大规模的数据中心里面,这个占比大家可以看到,到2020年,在超大规模的数据中心里面的服务器的占比相当高。刚才讲到的4%的发展也是考虑到对云计算这样一个大环境下,服务器巨大的IT设备的数量都是在超大数据中心里,超大数据中心又是能够达到1.2或者更低的PUE,所以说这个耗量量的增长是根据这样的预测来推出。

  能耗数据分析,如果你把服务器、网络、储存和基础设施分一下,大家可以看到在过去2000年的时候,PUE平均是1.9,到了2020年,全美国的平均值差不多在1.3左右。这个大家已经很熟悉,在基础设施上,特别是在冷却和供电这个部分,我们到底采用了一些什么样的措施,可以让我们的PUE降低,这个是不同的阶段我们所采用不同的技术手段来把我们的数据中心的能耗压到最低。

  接下来看一下PUE驱动微软怎么把效率来提高,大家可以看到演变的过程。PUE概念非常简单,大家可能因为讲得太多,听得太多,把PUE最初的初衷是什么,可能很多人已经模糊了。绿色网格第一次提出PUE的时候,明确提出PUE使用的一个要点,那就是不要把一个企业的数据中心的PUE和另外一个企业的数据中心PUE进行比较。PUE是为一个企业做自我衡量评估,你自己作为一个企业,我来衡量一下我自己的数据中心今天的基准线在哪里,然后采取了提高数据中心能效的一些措施,明年、后年,五年以后我再来平衡一下,看看我的PUE是不是降低了。

  数据中心是为了支撑行业企业的商业行为,一家银行的数据中心跟互联网数据中心完全没有可比性,或者说你一家建在挪威的数据中心跟一家建在新加坡的数据中心,也没有可比性,因为地域不一样,气候环境不一样,或者说商务用途不一样,所以这个比是没有意义的。

  整个行业可以说谷歌是走在最前面的,这边花俏的图是用AI管理PUE的结果,他在做什么,把所有和PUE相关的东西包括软件的运行,包括地域环境,包括外界气候,包括你采用的制冷,供电配电的方法,做一个这样机器学习的过程。因为他的软件、他的搜索,他的工作负荷可以从一个地区转到另外一个地区,比如这个地区今天特别热,他就可以自动把这一部分的工作量转到另外一个区域去,就不用在这个区域里面打开机械制冷,就可以使用另外一个区域的自然制冷,从而把PUE控制在最低。右边这个图,蓝线是模型所预测的,如果说这样做了以后PUE会怎么样,黄线是实测的PUE数字。如果说你是一个企业,你是一个银行,你能做到这样吗,你有多少个数据中心可以这样来切换,你的速度能赶上吗。谷歌可以做的你不一定可以做,但是谷歌给大家提供了一个这样的概念,让机器学习来看你为了满足你的商务需求的情况下,你有什么可以做,怎么样利用现在最新的技术,AI也好,或者其他的冷却技术也好,怎么在你的大框架下怎么样达到最有效的利用能耗。

  这个是Facebook,上面1.06是实时的PUE,下面1.09是全年平均的PUE。对Facebook很有意义,今天1.06,明天如果说到了1.1的话,可以看一下到底是什么原因造成的,是外界的气温升高了还是由于其他的原因。这个是对他有直接的影响。

  大家一直在讲PUE,左边是2007年美国能源部的一个报告,PUE提到了10次,今年提到了50次。虽然大家都知道PUE是一个不完善的提法,有很多缺陷或者说应用上如果应用不当会有误导,但是总体来说是需要我们的用户对PUE有一个深刻的理解,怎么样有效的使用它,来帮助我们提高能效。

  革命尚未成功,绿色尚未成功,任重道远,未来几年大家可以猜测一下云计算会是怎么样的情况,但是我估计没有人能够明确说今后会是怎么样,这个技术发展实在太大。我们作为一个行业里面大家对绿色关心的这样一群同行,怎么样来想办法把这个工作做好,不能完全依赖以前成功的经验,要往前看。

  一开始的时候我讲到,PUE这样一个东西或者说能效这样一个成果,像一棵树上结的果子,这个果子在比较低的地方容易被人踩掉的地方,已经踩得差不多了,接下来的任务很艰难。今年我们绿色网格在全球论坛上,有一个白皮书,在欧盟地区他做了一个测试,他挑选了几百家企业,对他们进行询问,说你们企业有没有把数据中心节能作为一个任务或考核指标,50%被询问企业回答说“没有”,这是一个巨大的数字。就问了,节能对环境有好处,第二对你的企业,可以省钱为什么他们对节能不感兴趣?这就让我们绿色网格对这个做了一个深深的反省。第一,大家要想到,一个企业建造一个数据中心,目的是什么,他的目的不是为了节能,没有一个企业说我去建造一个数据中心是为了节能,建造数据中心是为了支撑企业的业务,对数据进行分析也好,做财务报表也好。让数据中心负责人晚上睡不着觉的是什么,数据中心的安全,有没有扩容能力,我明天要增加10个机柜,我这个数据中心里面供电够不够,供冷够不够,可持续性、省电也是一个很重要的东西,大家同意这个观点,这个省电肯定不是最高的要求,你不会因为没有省电而被你老板干掉,这是一个很现实的问题。怎么样把企业对数据中心真正关注的东西,我们把它跟节能联合起来,只有这样联合起来,我们作为绿色网格,我们的宗旨就是要节能,在数据中心里面怎么样把所有资源的利用率提高到最好,我们要做的就是怎么样来把数据中心最关心的事跟节能联合起来。

  这个是绿色网格最近发表的一篇白皮书,等一下张粲总会跟大家做一个更详细的介绍。这里简单说一下,以前我们要提高PUE,今天的PUE我们是在1.5,明天到了1.4,那我们就成功了。这个是什么意思,它给你一个方法论,如果说我对我的数据中心进行一定的改造,让它的能效提高了,PUE从1.6,如果说我换了一个制冷设备,或者说利用了外面的新风,或者水侧自然冷却,我预计我的PUE降低了。在降低的同时,我是不是影响其他两个维度呢,对我的扩容性有没有影响,这是一个更全面的。我们有银行,或者大家跟金融行业打过交道的,就很清楚,你帮我省钱没用,你怎么帮助我提高我的可用性、在线率、可扩容性,如果能把这几个问题解决,再来谈能效,他就愿意来接受这个谈法。这个方法论给大家提出的是怎么样来把一个数据中心跟制冷相关的东西,怎么样来全面衡量,或者说我要提高在线率,在线率提高以后我对PUE的影响是什么,在我执行之前需要有一个概念,我是把PUE变高了还是变低了,这个工具给大家提供这样一个方法论,对数据中心牵涉到冷却的做一个全面的评估。第一,你可以说我的基线在哪,第二,我今后如果说做某些方面的改进也好,或者说机柜增加也好,对这三个维度的影响是什么,而不是说盲目对机房加了设备、减了设备或者进行一些改进,这样我们对整个的数据中心综合性的评估,最终可以让我们PUE的值变得更低。

  刚才讲了,一开始我们的关注点就是PUE,刚才一个三角,把运维这方面的东西也引进来。还一个基础设施,基础设施里面大家所熟悉的,比如说在讲到数据中心的等级,是一级的二级的三级的四级的,所谓讲到四级,我们现在只是讲四级,而不是说在线率是四个9还是五个9。其实真正要讲的是我这个数据中心建造的时候需要它的在线率是多少,在线率是目的,这么实施是手段。由于数据中心等级已经使用了很长时间,从90年代就开始的东西,我们已经本末倒置了,我们不说目的而只说手段了。应该换位思考,其实我要的是五个9还是六个9还是四个9,至于我用什么样的手段并不重要,可以用的手段很多。一个数据中心,把手段和目的等同起来,现在有很多新的技术,太阳能也好,风能也好,燃料电池也好,自然冷却也好,各个方面的技术,我们没有办法用现有的等级标准对我们的数据中心做一个在线率的评判,它没有办法做。绿色网格现在做一个OSDA,开放性的开放标准,就是说要把数据中心的在线率变成一个公开的平台,给你提供一个工具,比如我要用燃料电池了,我把燃料电池相关的数据输入进去,最后输出是几个9,或者这几个9跟我数据中心的能效有什么关系,对数据中心做一个综合的评估,而不是单独的说我的供电是到了多少。

  OSDA的一个目的是怎么样来推动这个行业大胆的创新,大胆的采用新技术,而不是很盲目的。你要去采用新技术,你对你的领导说,我要采用这个新技术,领导说你这个是uptime几级,uptime没有办法评,领导肯定不让你做,所以说这个就是对新技术的开发、新技术的应用变成一个障碍,我们就是要把障碍给去掉。

  这是一个很简单的,用燃料电池双路供电,做一个小小的修改,整个数据中心供电这一块从五个9变到了六个9,在这之前我们是没有办法做这个事。

  我们现在在做白皮书也好,在做一个工具也好,这是一个很初步的时间线。我们非常希望大家来积极参与,如果您对这方面有兴趣,不要等到游戏规则出来了我来接受这个游戏规则,如果说您的企业是一个很大的企业,有影响力的,您来加入制定游戏规则的行列,十把跟您企业有直接关系的产品也好、应用也好,有直接关系的,把您关心的东西加入到这个里面。希望大家积极参与。

  回到原来的话题,面临的挑战很多,如果说要考虑到2020年有4亿台服务器的话,我们该怎么办,还有很多的路要走,希望我们大家共同努力,来让我们这条线变得越来越平稳或者降低。

  谢谢大家。

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/20161019/n498988087.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片