机房360首页
当前位置:首页 » 战略与策略 » 不要为了明天的数据中心效率而回顾过去

不要为了明天的数据中心效率而回顾过去

来源:机房360 作者: 更新时间:2022/10/19 16:56:58

摘要:所发生的一切是一项非凡的工程壮举。在半导体层面上,像英特尔和AMD这样的处理器设计师在遵循摩尔定律的同时,不断提高处理器的效率。创建了新的数据中心,然后遵循冷却和设计方面的最佳实践。旧设施被逐步淘汰,取而代之的是由超标量机建造的先进数据中心。云计算还意味着服务器利用率飙升,闲置的服务器减少,不必要地消耗电力。

  数据中心行业的历史是前所未有的增长。随着世界联系的日益紧密,世界各地涌现出了为人们和企业服务的设施。

  每天都会有一家大型新工厂的消息,里面装着越来越高功率的信封,里面装满了啤酒芯片。尽管如此,该行业仍然能够避免能源大幅飙升,这证明了该行业的巨大创新和运营方式的转变。

  这一特征出现在《能源转型》补充资料中。今天免费阅读。

  但是好时光能持续吗?

  2020年,西北大学、劳伦斯伯克利国家实验室(LBNL)和库米分析公司发布了一项关于全球数据中心能源使用的开创性研究。

  他们发现,在2010年至2018年间,计算量猛增了550%。互联网协议(IP)流量增加了10倍以上,数据中心存储容量估计增加了25倍。

  在同一时间段内,能源消耗仅增长了6%,达到203TWh。

  这种惊人的差异值得注意——在电网不确定性不断增加的时代,以及数据中心对碳排放的影响已经受到关注的情况下,很难想象如果与计算呈线性增长,该行业将如何对待。

  长期以来,有缺陷的指标和分析过分简化了数据中心需求和电力之间的联系,多年来预测不断膨胀的能源使用量将淹没电网。该论文的合著者、LBNL的Arman Shehabi博士告诉DCD:“预测数据中心用电量的一种快速方法是,将用电量与其他一些值进行缩放,这样你就可以根据观看在线视频的人数、人口增长或从财务角度看市场的总体规模进行缩放。”。

  “你会开始发现奇怪的推断,因为每年都有多个变量在变化,比如你有更多的服务器投入使用,但这些服务器的使用方式在变化。所以许多不同的部分变得更高效,或者存储变得更高效、处理器在变化,数据中心使用的冷却系统也在变化随着时间的推移而改变。”

  所有这些都必须包括在内,他说:“存储的存储容量是多少?IP流量增加了多少?我们看到了多少工作负载?所有这些都需要考虑。”

  他解释说,一些方法着眼于本世纪初流媒体视频使用了多少数据,以及需要多少功率,然后尝试将其扩展到今天的流媒体需求。他说:“但是能源使用量相应增加了吗?当然没有。”。

  所发生的一切是一项非凡的工程壮举。在半导体层面上,像英特尔和AMD这样的处理器设计师在遵循摩尔定律的同时,不断提高处理器的效率。创建了新的数据中心,然后遵循冷却和设计方面的最佳实践。旧设施被逐步淘汰,取而代之的是由超标量机建造的先进数据中心。云计算还意味着服务器利用率飙升,闲置的服务器减少,不必要地消耗电力。

  “早在2005年,我参观了LBNL的一个数据中心,”Shehabi回忆道。“那里有一排排服务器,然后这些不同的机房空调就放在地板上,随意地放在不同的位置。有所有这些不同的地方,热空气与冷空气混合在一起,这些台式风扇在不同的地方吹着空气。这是非常低效的。就像建造冰箱,而不是p把门关上。

  “因此,一旦你想好‘让我们把门打开’,你的效率就会大大提高。”

  在跟踪当时能源使用情况的过程中,他发现数据中心和服务器机房的冷却耗电量是IT耗电量的两倍。这相当于3.0的巨大电力使用效率(PUE),这一数字已经大幅下降,以至于像谷歌这样的超级标量公司声称PUE只有1.10。

  同事乔纳森·库米(Jonathan Koomey)也研究了“僵尸服务器”的流行情况,也就是说,尽管没有任何用途,但仍在运行的服务器。他发现,世界上有10%的服务器可以被归类为僵尸服务器,因为没有人关闭它们,所以只会浪费电力。“所以这是提高效率的另一个大机会,”他说。更难追踪的是那些确实使用过但利用率低的服务器,这意味着大部分计算都没有使用过,但随着云的增长,这一数字也有所提高。

  这都是值得庆祝的事情。如果没有数十万数据中心、IT和半导体工作者的共同努力,该行业将无法支持其增长,因为电网根本无法满足数字世界的需求。

  但是,正如早期成功的祸根一样,保持这种速度并不是保证的。Shehabi说:“我认为,进入未来会更加困难,因为那些显而易见的低端水果机会并不存在。”。“还需要有其他方式来提高数量级效率,以平衡我们可以从该行业获得的服务的数量级增长。”

  数据中心建设速度没有放缓的迹象,尤其是因为疫情加强了对超级互联员工的需求。保持这种增长而不让用电量失控将是我们这个时代的巨大挑战之一。

  在芯片层面,已经有理由担心。半导体的发展速度已经不像过去那样快了:摩尔定律的消亡现在已经成定局,但它的消亡是一个长期的呜咽,而不是突然的爆炸。晶体管密度的改善早在2010年就开始放缓,并且速度逐渐加快。制造商们正在触及晶体管的物理极限,目前尚不清楚在2-3nm工艺节点之后还能走多远。

  芯片设计者对此反应激烈,他们探索了新的途径来提高晶体管密度以外的性能。但他们也通过增加处理器的热设计功率(TDP)来保持计算能力的改进,本质上是通过将更多的电能推送到芯片来获得更多的计算能力。但这增加了服务器的电源需求和冷却需求。

  然后是数据中心布局。虽然仍有一些旧的设施保留着,工程师们乐于分享竞争对手效率低下的故事,但事实是,许多明显的改进已经取得。平均数据中心PUE已经下降,但开始在出血边缘停滞不前。关于平均PUE的研究有所不同,但现代注重效率的设施(在宽容的气候条件下)被认为约为1.2。即使降低了这一数值,从1.2下降到1.1也不会显示出与从2.5下降到1.2相同的改善。

  与此同时,降低PUE的条件越来越困难,这不仅仅是因为芯片越来越热。更严重的问题是,世界正在变得越来越热。今年夏天,英国的谷歌和甲骨文数据中心在酷暑中停止了工作。这些设施是为即将消失的气候变化前世界建造的。预计未来的设施将内置更多的冷却设备,更定期地运行,因为环境空气不可靠。

  超级扩展器还能够以规模效率降低浪费,建立可以共享基础设施设备的大型服务器场。现在,他们的目标是Edge,要么在城市中建立较小的数据中心,要么建立小到半机架的微型数据中心。这将意味着失去这种规模,但Edge供应商认为,他们将减少来回传输数据所需的功率。《边缘》的故事还处于初级阶段,所以现在说哪个会比哪个更重要还为时过早。

  面对对能源使用日益严格的审查,以及服务器温度越来越高的情况,许多数据中心运营商都在拥抱水。

  直接液体冷却是一个长期目标,因为水具有优越的吸热性,这意味着所需的冷却功率要少得多。但这意味着数据中心硬件将发生重大变化。短期方法是使用蒸发冷却,这会增加耗水量。

  Shehabi说:“随着对PUE指标的强烈关注,行业做出了反应,并表示:‘让我们向它泼水吧。’但现在你消耗了更多的水,因此你已经通过制造另一个洞来堵住了一个洞。”。

  如果做得好,水的使用确实可以帮助阻止大规模电力增长,但同样不清楚有多少数据中心计划真正考虑到了不断变化的世界。美国正处于一场历史性的、持续不断的干旱之中,然而数据中心仍在努力争夺水源(通常甚至饮用水),并获得不可再生的含水层储量。

  在英国,公用事业公司泰晤士河水务公司在伦敦和斯隆启动了数据中心水探测,声称该部门在干旱期间用水过多。但这一声明是在大伦敦管理局表示,由于数据中心已经占用了所有电力容量,西伦敦的新住房项目可能会被封锁十多年之际发布的,这突显出随着电力和冷却解决方案变得难以保障,该行业将不得不保持微妙的平衡。

  Shehabi仍然抱有希望,他指出,对于某些工作负载来说,专业芯片更高效,而且该行业的创新能力也很强。但他警告说,挑战是巨大的。

  美国国会正式启动了漫长的官僚程序,最终将导致Shehabi团队编写一份新的数据中心电力使用报告。“坦率地说,自我们上次研究以来,行业已经发生了彻底的变化,我预计这将是一份真正具有开创性的报告。我不知道电力使用的趋势会是什么样子——是与我们过去看到的一样,还是会出现更大的增长或下降。我们只是不知道。”

  责任编辑:张华

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/20221019/n0396149591.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
转载声明:凡注明来源的文章其内容和图片均为网上转载,非商业用途,如有侵权请告知,会删除。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片