机房360首页
当前位置:首页 » 数据中心资讯 » 监控、容量规划和预测分析如何帮助提升数据中心的效率并促进业务的增长(上)

监控、容量规划和预测分析如何帮助提升数据中心的效率并促进业务的增长(上)

来源:机房360 作者:litao984lt编译 更新时间:2018/8/15 10:09:16

摘要:当前,企业的数据中心可以当之无愧的说是商业的引擎。数据中心推动实现了现代文明的各个方面,从人们的社交联系到全球化的市场。但整个数据中心业界也消耗了大量的能源,这些能源足以为相当多的超大城市供电。但不幸的是,大部分能量却被浪费了。

  当前,企业的数据中心可以当之无愧的说是商业的引擎。数据中心推动实现了现代文明的各个方面,从人们的社交联系到全球化的市场。但整个数据中心业界也消耗了大量的能源,这些能源足以为相当多的超大城市供电。但不幸的是,大部分能量却被浪费了。

  数据中心的成本一直都很昂贵,无论是其构建建筑成本还是保持其长期的健康运行的运营成本。任何一家公司都不会让数百万美元的资产以低于最佳效率的方式长期运营。在本文中,我们就将为广大读者朋友们介绍数据中心运营商们如何借助实时的监控、容量规划和预测分析等相关技术来帮助提高其数据中心的灵活性和运营效率,并在尽量降低成本的同时,确保实现更高的性能。

  借助数据中心,使得我们当前可以生活在一个保持永远在线,始终连接的数字化世界中。虽然当前的主流媒体往往更倾向于关注诸如亚马逊、脸书和谷歌等家喻户晓的大型云服务供应商的设施,但事实上,这些大型的云服务供应商仅仅只占构成当今全球经济支柱的数据中心的一小部分。而与此同时,作为人们当前社会工作生活中的一项无处不在的事物,还有相当多的非数据中心业内人士对于如何确保数据中心的健康运营知之甚少。

  简而言之,数据中心是一处包含了大量的IT设备,以及支持这些IT设备运行的基础设施的地方(这些提供支持的基础设施主要是电力供应和冷却相关设备)。虽然某些数据中心所构建的规模庞大的数据仓库(Data Warehouse)已经被各种设施所填满,但更多的企业数据中心建筑物则仅仅只被占用了大约几百平方英尺的空间,其他空间则是被用于普通的办公。

  企业数据中心的长期运营消耗使用了大量的能源——在某些情况下,由其所消耗的电力资源可达到普通办公空间电力消耗量的200倍。大多数企业数据中心每年的电费开销甚至都高达数百万美元。对于任何经济体而言,这都是真正实打实的真金白银的费用开销,更不用说他们还需要面临当今全球市场日渐激烈的竞争形势。此外,有鉴于当前大部分工业化国家能源成本持续不断的上升以及伴随着全球气候变化相关的法律监管更加严苛的可能性增加,外界普遍认为,大多数企业数据中心运营商亟待将提高能源效率作为其最高优先级业务事项。

  但全球范围内的数据中心运营商们真的是这样做的吗?事实并非如此!

  根据最近的一项针对数据中心业界的从业群体(受访者包括2000多名数据中心,IT和设施管理人员)所进行的一项调查显示,能源效率问题在这些受访者最关注问题清单排名中,仅仅只排到第四名。那么,这些业内人士所真正最关注的问题是什么呢?他们所真正关注的问题是——如何实现充分的数据中心监控和管理功能、可用性、技术变更和变更管理。

  这些问题的共同点是:确保数据中心相关设备的可用性。在必须确保永远在线的世界中,数据中心无法脱机。故而小至哪怕看似微小的变化或误算,电路跳闸过载,以及大到计算机服务器机房的空调机组(CRAC)单元发生故障,未受监控的服务器发生过热,不间断电源发生故障,基础设施停运,都是不能容忍的。

  由于当前企业的数据中心一旦发生停机中断的成本代价会非常昂贵,因此这些问题往往会让企业数据中心的运营管理人员们夜不能寐。在由安全研究中心Ponemon Institute所进行的一项调查中,受访者表示,他们所在企业的数据中心每次发生停机中断事故的平均成本损失将高达690,204美元。而这一数据还仅仅只是包括了那些易于量化的损失影响——包括发生业务中断的损失、企业营收损失、生产力下降损失和设备维修成本开销等。此外,企业声誉的损失则难以衡量,但企业声誉方面的损失持续时间更长,而且其对于企业净利润的影响甚至将会远远超过实际中断事故的账面损失。

  那么,企业数据中心的运营管理人员们究竟要如何确保其可用性呢?大多数的数据中心运营管理人员都倾向于采用多管齐下的方法:在数据中心的设计中加入冗余系统,采用最佳的运营管理实践方案和维护程序,并使用数据中心基础设施管理(DCIM)系统等创新和综合型的技术来提高可靠性。

  DCIM技术有助于运营管理人员们更好的监控数据中心内的电力和环境条件,构建和维护资产数据库,促进容量规划,协助变更管理。在Uptime Institute 针对全球范围内的数据中心运营商所进行专业调查显示,受访者们普遍认为,推动当前的企业数据中心纷纷积极的普及采用DCIM的三大主要驱动因素分别为:实现更好的数据中心容量管理;第一时间及时识别可能威胁到数据中心可用性的潜在问题;以及推动实现更好的资产和数据中心运营状态的可见性和可管理性。

  如下,我们就将为您重点介绍实时的监控、容量规划和预测分析技术如何帮助企业数据中心的运营管理人员们提高其设施的灵活性和效率,并以更低的成本确保更高的性能。

  实时的监控可提高可用性,并降低运营成本

  通常,冷却方面的能源消耗都是数据中心运营过程中功率消耗(即,不包括实际的数据计算处理工作)的最大户。由于数据中心内部的相关电子设备在其运行过程中会产生大量的热量,而设备过热则更容易导致停机故障的发生。这就是为什么传统上数据中心的操作环境温度更像冰箱一样干爽,而不像是普通的商业办公场所的原因所在了。

  当前的数据中心运营商们可以通过采用诸多的技术和技巧来节省其基础设施的能耗。例如,美国采暖、制冷与空调工程师学会(ASHRAE)就推荐了最节省冷却成本的相关策略指南(例如,采用自然冷却,无冷却器的数据中心)。该指南扩展了推荐和允许的数据中心操作环境温度和数据中心内部设备的湿度范围。现如今,过去只允许在55-65̊F的温度条件下运行的数据中心可以将其操作环境温度提升80̊F至甚至90̊F,并且对于相关设备的湿度限制也并不那么严格。

  数据中心的这些操作环境所允许的温度和湿度范畴的变化对于数据中心能源消耗使用的影响可以说非常的大:在数据中心的操作环境内,服务器入口空气温度每提升1̊F,就可以带来2-5%的能源成本节省。

  我们以美国电信运营商巨头企业CenturyLink公司为例,该公司目前在全球范围内共计拥有55处数据中心。早在2011年,CenturyLink公司每年的电费账单就已经超过8000万美元了。此后,CenturyLink公司从试点设施项目开始,部署实施了一项监控计划,使其工程团队能够在不影响数据中心可用性的情况下安全地提高数据中心操作环境的供气温度。根据该试点的研究结果,CenturyLink公司在其遍布全球的所有数据中心中确定了290万美元的潜在年度电费节省。

  鉴于ASHRAE所推荐的该指南以及这些操作环境温度/湿度变化提升收带来的大量运营成本的节省,非业内人士可能会期望每家数据中心运营商都能积极的部署这些看似简单的调整。然而,事实上许多数据中心都没有这样做;根据Uptime Institute所进行的一项调查显示,有超过四分之三的数据中心从业人员受访者均表示,他们所在企业数据中心的平均服务器供气温度为65-75̊F——远低于ASHRAE所推荐的操作环境温度。

  由于转换时的损耗,设计不良的电源链以及低效的电源供应和电缆,使得配电和备用电源设备也会导致数据中心的能源浪费。与冷却方案一样,数据中心的运营管理人员们同样会积极的采用各种策略来提高电源效率,而能够带来最明显的电源效率提升的领域便是计算服务器领域。由于大多数数据中心都是按照其峰值需求的负载进行服务器资源配置的(而这种峰值需求每年可能只发生几天),故而服务器的利用率低是数据中心业界一大较为普遍的现状,同时也就为提高效率提供了大量的机会。有业内专家估计,大多数数据中心的服务器利用率仅为12-18%,有些专家认为数据中心所部署的服务器中有多达20%的服务器是24/7/365全天候通电,但几乎没有执行任何数据计算处理工作。这些“休眠服务器(comatose server) ”在其空闲时段仍然会像处理满容量时那样,消耗掉几乎相同的电源功率。此外,在设备级别所浪费的每瓦电力甚至还具有级联效应,因为同时还需要消耗更多的能量来为支持这些休眠服务器的物理基础设施供电。

  通过整合和虚拟化技术提高每台服务器机架的IT负载密度,不仅可以大大节省设备,同时还可以节省电力资源和空间。而如果数据中心的选址恰恰位于能源供应受限或电力和房地产价格高的地方,这显然是一项非常重要的考虑因素。

  在针对数据中心从业人员的调查中,有70%的受访者报告称,他们所在企业数据中心服务器机架的平均密度目前为2-8千瓦/机架。但几乎相同百分比的受访者预测,在未来两年内,他们所在企业数据中心服务器机架的平均密度将增加到4-16千瓦/机架。高密度意味着集中的热输出和改进的功率要求。在高密度服务器机架部署中确保持续可用性的唯一方法是对物理基础架构进行实时的监控和细粒度的控制。

  目前,企业数据中心推动实现更高能源效率的最有前途的创新措施之一是按计算分配功率比例或按计算需求匹配电源分配。然而,事实上,迄今很少有数据中心运营商真正使用可用的动态配置技术或已在其服务器上安装了功率封顶功能。

  那么,为什么数据中心运营商们并没有充分利用这些可能改变游戏规则的节省运营成本的措施,进而获取更广阔的收入提升的空间呢?

  风险。如果没有切实的实施实时监控和管理,提高数据中心服务器机架进气温度会增加设备发生停机故障的风险。而如果不详细了解数据中心的计算需求与电力动态变化之间的关系,功率上限会增加处理能力在需要时无法获得满足的风险。

  因此,我们可以说确保数据中心的可用性的重要性要胜过运营成本的节省。数据中心的可用性的重要性甚至可以说胜过其他所有方面。

  企业不必在可用性和运营成本节省之间做出非此即彼选择——他们完全可以同时实现“鱼和熊掌的兼得”。实时的监控为当前的企业提供了管理风险,提高效率和降低成本所需的相关信息。

  在一处智能化的数据中心,整个数据中心建筑设施中部署安装了数千个传感器用以收集关于温度,湿度,气压,功率使用,风扇速度,CPU利用率等信息——所有这些信息都是实时的。这些信息将会以允许数据中心的操作管理运营人员们能够在第一时间根据数据中心当前的条件进行理解,和调整控制的方式进行汇总、标准化和报告。

  让我们不妨假设这种情况:数据中心的某名技术人员在更换一部分高架活动地板时出错——其安装需要穿孔的实心瓷砖,或者反转的定向面板,以便能够使得冷空气吹入过道,而不是朝向服务器入口。这个看似微不足道的人为错误很有可能会对空气流量,温度和气压产生重大影响。在小问题恶化发展成为大问题之前,及时亡羊补牢的唯一方法是部署实施实时的监控。

  企业数据中心部署实施实时的监控能够带来不仅仅只是避免发生灾难的其它方面的益处。云服务、主机托管和托管服务提供商们可以使用他们所收集的数据信息来记录他们对服务级别协议(SLA)的遵从性。监控数据可以集成整合到数据中心建筑设施的楼宇管理系统(BMS)中,使运营商们能够进一步自动化和优化对物理环境的控制。宏观和微观层面的可视化提高了企业客户们的信心,简化了决策的制定,提高了数据中心的可用性,生产力和能源效率。

  责任编辑:DJ编辑

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/2018815/n4403106528.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片