机房360首页
当前位置:首页 » 环境监测 » 数据中心监控的最佳实践

数据中心监控的最佳实践

来源:机房360 作者:my编辑 更新时间:2012-7-11 12:07:52

摘要:数据中心监控架构需要定期维护和测试--就像任何设备一样。另外,适应数据中心的进化,不要把传感器放好了就不管。这里有一些关于数据中心环境监控的实践。

  1、测试和维护。所有传感器都得定期测试维护。不稳定或有问题的传感器必须及时替换。有一种测试方法是看其他类似传感器的报道。当一台机架内几个传感器报告同时报告同样温度,但是有一个传感器却与其他相异,那就得检查了,当然你也得看看是不是机架本身有问题。

  2、随时准备面对紧急状况。传感器本身不能防止紧急状况发生,所以你还要做好常规的计划。灾难恢复计划就得包含在内。你得知道数据中心运维团队是哪个,如何最快找到他们。当发生制冷故障,你得先找HVAC工程师。还得仔细描述问题。说道紧急故障,那可真是分秒必争。

  3、准备好后备计划。监控系统能设置不同级别的告警。如果数据中心是在托管环境,就得在服务级别的合同中指定紧急状况。托管商必须有意外事故的计划,以面对突然发生的问题。在私人数据中心里,总有传感器监控和告警系统运作。制冷装置可能会在紧急状况发生时保证本地后备部件--即使这意味这是用临时便携制冷设备。

  4、自动化恢复计划。有的监控系统整合了自动系统。一旦发生单独的机架事故,有的系统能关掉不必要的服务器。开发服务器通常好点很大,却不用在正常产品过程中运行。任何测试服务器如果不是必要的,都可以在紧急情况中关掉。

  随着数据中心进化,IT经理应该发掘更多自动化工具,来帮助环境长久运转。物理架构管理的自动化和中心化是数据中心设计运维的下一步。关键仍然在于策略性地保持正常时间。提前做好机房监控,IT管理员可以减少大量宕机危险。

  责任编辑:my编辑

本文地址:http://www.jifang360.com/news/2012711/n833738098.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
更多
推荐图片