机房360首页
当前位置:首页 » 动力监测 » 实现基础设施有效监控的十个步骤(续)

实现基础设施有效监控的十个步骤(续)

来源:机房360 作者:小柯 更新时间:2011-1-14 14:40:08

摘要:通过这10个步骤,数据中心关键设施的可用性和效率是可以量化的。几乎每个步骤都有助于监测数据中心的可用性,并能分析系统潜在问题从而提高响应速度。从整个监控系统中,管理员可以准确知道任何一个机架在什么时候发生了什么事件,集中报警管理和电池监测等基础设施监控从根本上消除了数据中心停机最常见的原因。

  数据中心基础设施有效监控的前提是精确的测量,这已在上篇文章(实现基础设施有效监控的十个步骤)中做了介绍。本文就目前数据中心的基础设施所配备的控制系统展开讨论。
  
  二、控制管理
  
  4、精密制冷系统的智能控制
  
  把智能控制整合到房间空气调节器里,可以更高效、更精确地控制温湿度。智能控制系统可以协调多个制冷机组运行,使个机组之间实现功能互补并避免冲出。例如,对湿度的控制,绝对湿度的控制方式可以按空气中的水分含量控制湿度,不会因温度波动引起相对湿度波动,造成机组不必要的加湿或除湿动作,也节约了不必要的能耗。数据中心或者机架级制冷系统的控制系统还可以缩短管理人员对系统问题的响应和维护时间,控制系统还能根据所搜集的数据对组件进行预测分析,对整个系统维护提供依据。另外,详细的事件日志、服务历时记录、备件清单都能提高服务的效率。
  
  5、供电系统的智能控制
  
  现在,数字化和智能化大大优化了UPS供电系统的性能。UPS的智能化主要通过系统的控制软件实现。在系统运行状态识别与控制方面,通过内部传感器和状态逻辑及识别系统所处的运行状态,判定系统运行程序和运行是否正常。数字化则是采用数字信号处理算法,有效地解决并行系统之间的相互沟通问题,以减少故障机会。在大部分情况下,还能自行诊断故障并且随即解决问题。如果遇到用户预先设定的重大故障,则会直接报警。
  
  通过能源优化和智能并联等特性还能使系统更有效地运作。能源优化模式在提高UPS系统对IT负载供电效率的同时,还具有调节功率的特点,例如在电力需求不高的周末或晚上,可以对供电功率进行调整,就能有效避免不必要的能源消耗。
  
  并联智能控制为模块化UPS提供了一个提高效率的途径,它不仅能对多模块并联UPS进行智能管理,还可以实现自动关闭不需要支持负载的UPS模块,以提高系统效率。
  
  6、集中监控和管理
  
  集中监控的目标就是要能够通过管理与技术的应用,对基础设施与IT基础架构的运行情况进行监视,实现故障与异常的实时发现与通知;此外还可以通过对监控数据搜集与整理,为容量管理、事件管理、问题管理、符合性管理提供分析的基础,最终实现数据中心高可用性的目标。
  
  目前,数据中心的供电系统和制冷系统都可以显示运行数据,例如可以显示机架服务器的入口温度,这些工具的使用都推动了集中监控系统的发展。
  
  7、报警和警报的管理
  
  对数据中心基础设施集中监控的目的是最大限度地减少系统停机时间,及时有效地应对系统问题。集中报警管理系统为数据中心提供一个统一的运营窗口,对临界报警这种比较严重的事件可以做到优先处理。对多个同时报警的故障,可以根据对业务的影响度决定其处理顺序。
  
  更近一步的说,管理人员可以根据监测系统的数据来分析设备的运行状况,并执行有效的维护计划。
  
  8、监测能源使用效率
  
  在大多数情况下,数据中心并不会安装相应的能源使用使用监测设施。很多数据中心的管理员觉得安装这样的设施很没有必要,这对提高数据中心的能源使用效率并没有多大的效果。其实并不是这样的,建立一套能源使用状况监测系统对于提高能源使用效率有着很好的激励作用,它能够很直观的显示出数据中心内部的能源状况。这可以提醒数据中心的管理员应该时刻关注数据中心的能源使用率并提高。
  
  建立这样的能源监测系统,可以根据数据轻松算出PUE值,有利于IT经理跟踪能源消耗,从而分析和优化能源的使用。
  
  9、电池监测
  
  为了防止数据丢失和提高正常运行时间,大多数数据中心需要一个专用的电池监测系统。电池监测系统可以把电池的潜在故障通知给管理员,最好的做法是实施一个监测系统,并跟踪串联电池组中的每节电池的健康状况。有效的电池跟踪监测系统包括对内阻参数的测量和对蓄电池充放电情况的监测,以确保测量的准确度。
  
  UPS的许多用户认为UPS本身已带蓄电池监测功能,无需再安装另外的蓄电池监测系统。确实,大部分UPS都带有一定的蓄电池监测功能,可以监测组压及记录放电曲线,但是对于准确掌握每节蓄电池的运行状况这些监测是远远不够的。UPS一般只能监测组压,不能监测每节电池的电压,一旦某节电池失效,组压往往还是正常的,而对于串接的电池组来说,这是非常危险的。
  
  10、远程监控管理
  
  在减少能耗的趋势下,数据中心远程监控和管理应运而生。你可以用最小的人力成本来执行关键任务工作,且不管你身在何处,这也就是无人值守的概念。但无论如何,远程管理确实节约了大量的成本。一个数据中心的管理者,只须考虑机架上的虚拟主机、高效的安全人员以及他的数据中心的地理位置,然后用远程管理操作数据中心,所有他所要做的就是坐视成本的急剧下降。此外,限制访问的另外的好处是,实际进入数据中心接触到计算机的人少了,因此发生意外及安全漏洞的机会也少了。这种远程管理用远程输入输出系统访问数据中心的服务器,这种方式还可以提高反应时间。通过这个系统,也可以实现地理上的独立性。
  
  三、基础设施监控的效益评估
  
  通过这10个步骤,数据中心关键设施的可用性和效率是可以量化的。几乎每个步骤都有助于监测数据中心的可用性,并能分析系统潜在问题从而提高响应速度。从整个监控系统中,管理员可以准确知道任何一个机架在什么时候发生了什么事件,集中报警管理和电池监测等基础设施监控从根本上消除了数据中心停机最常见的原因。
  
  在许多情况下,这些系统是相对容易实现的,而且一旦安装,可以对数据中心优化提供可视的和必要的控制。
  
  责任编辑:kelly

本文地址:http://www.jifang360.com/news/2011114/n564814877.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
更多
推荐图片