机房360首页
当前位置:首页 » 数据中心资讯 » 数据中心能源数据的问题

数据中心能源数据的问题

来源:机房360 作者: 更新时间:2022/10/19 16:55:39

摘要: “其他主要数据中心所有者并不那么透明,”Mytton说。“亚马逊报告的碳排放量只有一个单一的数字,这是其所有业务的总和,因此很难将数据中心从电子商务物流中分离出来。”

  今年冬天,随着价格飙升,每个人都将监控自己的能源消耗。当电价上涨,英国和爱尔兰至少有两家数据中心公司倒闭,而能源危机则归咎于此时,数据中心是否还能盈利。

  但更大的问题呢?整个数据中心行业对世界能源消耗有何影响?这对政策制定者来说是一个重要问题,但似乎我们的答案并不可靠。

  大多数数据中心专业人士都会耸耸肩,说设施用电量“约占世界用电量的2%”。他们会说这个数字来自报纸文章、分析公司或他们自己营销部门的幻灯片。他们还可能会说,由于虚拟化和云,他们听说数据中心的能源使用正在趋于平稳。

  其他人会给出更高的数字,他们说,在一些国家,数据中心用电量占世界用电量的7%或更多,到2030年,数据中心的用电量将占世界用电总量的51%。问问他们这个数字是从哪里来的,他们会引用不同的报纸文章、分析师和营销文献。

  企业家兼学者大卫·米顿(David Mytton)表示,这不是一个很好的讨论基础,他追踪了这些估计值的来源,以了解差异的来源。

  这是一项重要的工作,因为糟糕的数据会导致糟糕的决策。

  错误的数据、错误的操作

  “这种巨大的差异……让想要帮助解决环境问题的普通公众感到困惑,”Mytton和他的同事Masao Ashtine在一篇论文《数据中心能源估算的来源:科学杂志Joule review的综合评论》中说道。它可能会导致错误的节能努力,例如删除旧的社交媒体照片。

  更重要的是,这些不可靠的数据意味着数据中心运营商没有正确严肃地对待这个问题,能源网格无法为他们的需求制定计划,不可能真正了解数据中心在全球变暖中的作用,我们看到了一系列激烈但不确定的争论。

  “意外的需求给输电和当地配电能力带来压力,升级的前置时间很长,可能会对电网的其他用户产生连锁反应,”Mytton说。

  伦敦西部的三个行政区已经批准了新的数据中心,这些数据中心使用的电力相当于成千上万的家庭。因此,新的住房开发项目无法连接。

  在爱尔兰,电力需求在五年内增长了144%(从2015年的1.2TWh增至2020年的3.0TWh)。预计到2029年,数据中心将使用爱尔兰全部电力需求的27%,一些运营商已经推迟或取消了该国的数据中心项目。

  阿姆斯特丹在2020年暂停了数据中心建设,因为担心该行业的能源和土地需求。

  与此同时,根据项目,到2030年,丹麦15%的电力将用于数据中心。

  在所有这些情况下,更好的预测可能会避免出现引人注目的暂停或取消。

  当把电放在总能源使用的背景下时,事情就变得复杂了。大部分电力仍由化石燃料产生,因此数据中心的用电量可能占全球二氧化碳排放量的2%或3%(这是一个基于猜测的数字)。

  即使数据中心可以选择绿色能源,这也可能无济于事。各国从可再生能源获得的电力数量有限——如果数据中心使用可再生能源,那么供热和运输的电力供应就会减少,而这些部门迫切需要脱碳。

  糟糕的数据使这成为任何政策制定者的雷区,让他们任由特别请求的摆布。

  数据中心行业可以正确地宣称,数字化可以帮助脱碳(所谓的“碳手印”)。例如,如果Zoom会议取代了商务旅行,但其他人会说,任何部门都不应该获得能源使用无限制增长的免费通行证。

  没有准确的数据,立法者无法平衡这两个论点。

  “缺乏关于数据中心能耗及其增长方式的准确信息已经产生了影响,”Mytton和Ashtine警告说。

  可靠的数据

  为了进行分析,Mytton和Ashtine收集了过去16年发布的数据中心能源使用报告,这段时间可以追溯到2006年启动云时代的Amazon Web Services的推出。

  他们希望帮助行业提供更好的能源使用数据:“我们的目的不是批评个别出版物,也不是说某个特定的估算比另一个更准确。我们的目标是对该研究领域的常见方法问题进行广泛分析,以便未来的读者能够对估算的可靠性更有信心。”

  任何报告都只有其数据才是好的:“我们关注来源和数据输入,因为它们是决定科学可靠性的基础组件。”

  Mytton和Ashtine使用“Sankey图表”将引文从一篇论文追溯到之前的论文。(图2)其中许多引文追溯到第一份主要数据中心能源报告,该报告由美国国会委托,由劳伦斯伯克利国家实验室(LBNL)的研究人员于2007年编制,其中包括Jon Koomey、Arman Shehabi等。还有一篇由全球数据中心用电公司Koomey于2008年发表的论文。

  这两人检查了任何试图计算全球或美国或欧洲等地区数据中心能耗的英文出版物。

  他们列出了46种出版物的名单。这似乎是16年来对这样一个热门话题的研究所取得的令人惊讶的小成果,但这是有原因的。许多出版物只是引用或提及其他出版物。

  根据这些链接,Mytton和Ashtine发现了676个单独的“数据来源痕迹”或原始数据来源。其中许多已经不再可用,要么是因为链接断开了(所谓的“链接失效”),要么是没有原始文档的痕迹。有些是只有原始研究人员才能看到的商业信息,有些则没有给出如何得出这些信息的方法。

  缺失数据的问题是,信息可能已经发布,但现在并非如此:“网络链接不是永久性的,用作参考的网页也不再可用(当引用思科时,这是一个特殊的问题)。市场数据来源很少,通常只能从私人/商业报告或数据库中获得,这使问题更加复杂。”

  报告通常基于辅助数据。例如,服务器在某一年的能源消耗量通常是通过计算已发货的服务器数量来估算的,使用该数量来估算当年使用的服务器数量,并由此估算出这些服务器可能使用的能源量。

  一些消息来源被引用的次数比其他消息多。例如,尽管很难直接看到他们的数据,但分析公司IDC和思科分别在43%和30%的出版物中被引用。对这些数据的实际依赖程度更高,因为一些论文引用了早期依赖思科或IDC数据而未明确引用的数据。

  由于只有三分之一的信息来源来自同行评议的出版物,因此存在可靠性问题。另有38%的人仅仅来自“报告”,这可能意味着行业出版物或自行发布的文章。尽管没有出版年份,但一些数据点已被发表在论文中。

  这些报纸以不同的方式处理数据——一些引用了碳排放,另一些引用了直接能源使用。为了进行比较,所有单位都转换为相同的单位——每年太瓦时(TWh)。

  估算和外推

  值得强调的是,所有这些引用的能源使用数据都是估算值。没有一个单一的能源机构对世界上的所有能源消费者进行分类和添加,甚至在个别地区内也没有。

  这些报告使用不同的方法来收集其来源,并计算数据中心能源使用的估计值,然后使用其他数据点和假设进行推断,以给出未来能源使用的可能数字。

  他们也采取了不同的方法,比较它们可能是一场噩梦,Mytton说:“Koomey排除了存储和网络组件,Somavat等人从Brown等人那里获得了美国的总数,然后假设美国占全球总数的一半,将其加倍,Andrae和Edler排除了内部数据中心网络,而将其作为全球网络的一部分,Masanet等人排除了比特币,而Montevecchi等人将其包括在内。”

  要获得所有这些并生成数字,基本上有三种方法:自下而上、自上而下和外推

  自底向上建模将结合服务器的指定功耗等数据,并将其与安装基数的估计值相结合,再乘以数据中心的平均电力使用效率(PUE),以获得设施中使用的能源数量。

  这很好,但公布的数据可能无法全面反映情况。例如,一些报告将能源使用基于SPECpower基准数据,但这可能是不正确的。Van Heddeghem及其同事的一份报告发现,SPECpower数据库偏向于更节能的服务器,而按功耗计算,效率较低的卷服务器是最大的组。

  当模型必须根据今天的数据和观察到的趋势预测未来能源使用时,问题变得更糟。这很棘手,因为设备可能会发生变化,变得更高效,或者由于转向更高要求的任务,更耗电的系统开始出现。

  “越远,由于难以计算能源效率的提高和设备变化趋势,估算范围越广,”Mytton说。

  2007年LBNL的论文提供了一个关于外推危险的极好例子。该研究发现,美国数据中心的能源使用在2000年至2005年间增长了90%,并警告称,从长远来看,这是不可持续的。

  2011年,乔恩·库米(Jon Koomey)的后续报告指出,美国经济增长实际上已经放缓。之后,2016年LBNL报告显示,能源使用实际上趋于平稳(图3)。

  原因是云应用程序增长迅速,但交付效率高于内部数据中心提供的服务,而云正开始取代这些服务。

  未来的变化

  但自2016年以来发生了什么?云提供的效率可能已经达到极限,或者提供云的超大规模数据中心可能正在推动消费者服务的大规模扩展。

  2007年,LBNL报告对超大规模数据中心进行了折扣,认为它们微不足道。该报告由Arman Shehabi领导的2016年续集估计,超大规模容量将占2020年服务器总安装量的40%以上。

  美国似乎有更多的超大规模数据中心(约占世界700个数据中心中的400个)。“美国的这种关注被认为是美国以外地区数据中心能源消耗持续上升的原因,因为美国受益于这些设施效率的提高,”Mytton说。

  加密货币是能源估算难以消化的另一个大未知数。它完全出现在2006年以来的这段时间里,因为最初的比特币白皮书于2008年发布,现在加密货币的能源使用问题受到了激烈的争论,据估计,加密货币的使用范围与小国一样大。

  值得指出的是,这个未知的数字不仅仅是“噪音”。这些数字与世界数据中心总能源的估计值相比非常重要。它们是大多数论文中较低场景的一半以上。

  数据中心能源研究人员在从加密货币市场获取真实数据时可能遇到困难,但他们忽视这一点会带来风险。

  即使是数据中心的新技术也很难预测。液体冷却可能取代目前数据中心中使用的耗能巨大的空调机组,但麦顿警告说:“人们普遍预计,数据中心设备的直接液体冷却将在未来七年内得到更广泛的应用,但目前很少有运营商拥有高密度机架来证明这一点。”

  自上而下的建模在当前统计数据上可能更可靠,因为它基于政府统计数据提供的区域总计形式的“实际数据”。然而,由于难以获得此类数据,这些研究非常罕见:Mytton和Ashtine只发现了Jens Malmodin的一项自上而下的研究,这项研究受到高度重视,但仅涵盖瑞典。

  有一些小迹象表明这可能正在改变。2022年1月,爱尔兰中央统计局根据电力供应委员会(ESB Networks)收集的实际电表读数发布了数据中心用电量数据。它将每年更新一次,因此在最具争议的数据中心市场之一,未来的政策可能基于良好的数据。

  然而,自上而下的模型并没有任何魔力可以让它们更好地预测未来趋势。

  外推模型从其他模型中选取一个基线,然后假设需求和消费之间存在相关性,以应用增长因子。

  “大多数外推计算都是基于传输的每单位数据的能源强度,并对未来预测的能源效率改进进行假设,”Mytton说。

  这会产生差异。例如,当Anders Andrae和Peter Corcoran采用Koomey自下而上的估计时,他们采用了更大的增长率,因为新的消费云服务将促进增长并增加能源需求,即使服务效率更高。

  Andrae的论文倾向于计算每个CPU指令所用的平均能量,然后推断出给定年份世界将使用的CPU指令数。

  多少能量?

  鉴于数据的多样性,Mytton和Ashtine没有提供数据中心能源使用的可靠数据也就不足为奇了。无论如何,这不是他们的目标。

  总的来说,这篇论文得出了258个数据中心能耗估算值,包括全球179个。美国24人,欧洲19人。这些“欧洲”数字涵盖了另一层次的多样性,因为它们涵盖了不同的分组,这取决于是否包括欧盟、欧洲经济区或其他国家。德国、瑞典和中国也有单一国家的估计。

  根据全球的估计,2010年能源数据中心的使用量是一致的,但2020年的估计值有所不同,到2030年,它们相距数英里。

  该报表示:“未来越远,范围越广。”。“这是可以预料的,因为过去的估计可以根据实际数据进行计算,而未来的估计必须对能源效率和服务器出货量等关键参数进行假设。”

  Mytton和Ashtine报告了2030年数据中心总能耗的最小和最大预测值之间的数量级差异,从每年146TWh到1929 TWh。

  实际数字甚至更高,因为他们排除了五个预测数据中心能源将跃升至每年8253太瓦时的外围估计。

  这些变化大多是由于无法预测技术变化。“一方面,工作证明区块链挖掘需要大量能源,但另一方面,许多IT工作负载已经从低效的企业数据中心转移到更高效的超大规模云系统,”Mytton说道。“与台式计算机相比,智能手机已成为一种重要的计算设备,具有更节能的处理器,但新5G蜂窝网络的功率状况仍存在问题。”

  发生移位

  预测的最大问题是,外推将增加并扩大数据中现有的弱点。米顿警告说:“这种滚雪球式的偏见是一个问题,因为出版物依赖于早期的估计,而没有严格评估其假设和来源。”。

  例如,他对华为雇佣的分析师安德斯·安德雷(Anders Andrae)的工作颇为不满,安德斯·安德莱于2019年发表了三篇预测论文,这些论文基于能源使用与网络流量相关的假设。法国智库The Shift Project在其论文Lean ICT-Towards Digital Sobrity中采纳了这一观点。

  Mytton和Ashtine表示:“尽管无法获得支持the Shift Project发布的估算的大多数来源,但大量主流媒体引用了这份报告。”。

  这种假设,即网络流量与能源消耗之间存在直接联系,自2013年以来在研究中未经审查就被重复使用,但Jens Malmodin和Dag Lunden至少在两篇论文中驳斥了这一假设。

  特别是,过去几年有直接证据。流感大流行期间,人们转而在家工作,这增加了网络流量,而能源使用量也没有增加的报道。

  值得一提的是,尽管Shift Project报告经常被引用,但由于错误的原因,它在Mytton的Sankey图中脱颖而出。除了两个主要来源外,其他所有来源都不再可用。

  我们现在需要什么

  我们需要更好的数据来制定未来战略,这意味着运行云和数据中心的私营公司需要更加透明,

  Mytton承认,谷歌和微软都走在了前面,他们都发布了关于能源消耗、可再生能源采购和PUE数据的顶级统计数据。

  “其他主要数据中心所有者并不那么透明,”Mytton说。“亚马逊报告的碳排放量只有一个单一的数字,这是其所有业务的总和,因此很难将数据中心从电子商务物流中分离出来。”

  所有三家最大的超大规模云提供商都为其客户提供了一个计算器,以显示其云工作负载的碳足迹。

  “这种透明度很重要,因为将IT工作负载迁移到云将运行基础设施的运营排放外包给云提供商,”Mytton说。当然,这也是一个很好的营销,因为云资源通常比内部运行的同等资源更节能。

  Colocation提供商和数据中心运营商(如Digital Realty和Equinix)也提供了一些数据,但Uptime Institute的研究表明,数据中心所有者更可能报告其能源效率(对成本有影响),而不是碳排放和环境足迹。

  加密货币的实际能源数据对于希望定期使用能源的政府至关重要。Mytton警告说:“对加密货币开采活动的简单禁令已被证明会导致更多的碳密集地区流离失所。”。

  从根本上讲,数据中心的建造(和正在建造中)速度可以快于电力容量。这导致了阿姆斯特丹、伦敦、爱尔兰和其他地方的(字面上的)权力斗争。

  更好的预测可以导致更好的计划,也许可以避免负面后果。

  “阿姆斯特丹引入的限制需求的解决方案能够提供确定性,以便电网运营商能够提供适当的基础设施升级,但也限制了it提供商在该地区发展服务的能力,”Mytton说道。

  “当需求超过供应时,价格将不可避免地上涨,这可能会影响低收入人群从数字服务中受益的能力。”

  责任编辑:张华

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/20221019/n3856149590.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
转载声明:凡注明来源的文章其内容和图片均为网上转载,非商业用途,如有侵权请告知,会删除。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片