机房360首页
当前位置:首页 » 机房监控 » IT微环境——现代机房监控的基本要素

IT微环境——现代机房监控的基本要素

来源:《机房技术与管理》2008年02期 作者:蔡维克 更新时间:2009/10/10 14:52:30

摘要:随着计算机技术及网络技术的迅速发展,信息系统不断升级,现代机房的建设如火如荼。如银行、证券、通信等一些行业,其业务主要依靠网络及其设备操作运行,但如何更高效、更安全地管理服务器或计算机,已成为用户必须面对的重要课题。国内专家针对目前我国机房建设与管理的现状,总结为“一流的设备、二流的设计、三流的管理”,而机房监控更是机房管理的薄弱环节。

1传统机房监控技术的局限
  
如今,现代机房的一个明显特点是IT设备的模块化、轻薄化、机架化。机房内采用了越来越多的刀片式服务器、机架UPS等设备。设备中高性能的部件所占用的物理空间却越来越小,无数发热的CPU和电子元器件集中机柜、机架内,加大了冷却散热系统的工作难度;目前,机架中温度调节、热量管理、线缆管理等环节没有得到足够的重视,机架内部环境威胁着IT系统的整体可用性;系统的稳定性除了电源因素外,最大的相关因素就是环境温度控制,温度过高是损坏系统元器件的重要因素;而传统的机房监控在设计理念和产品技术上都相对落后,已经不能适应现代机房监控的需求。。

1.1传统机房中环境温度控制措施不当
  
目前,传统的机房制冷系统与IT设备模块化、机架化的特点脱节,没有考虑机柜内部IT设备的散热问题,仅考虑由空调本身的制冷能力来达到“冷却”服务器的作用。但事实证明,这种方法只能对整个房间的温度进行控制,并不能很好地调控机架中服务器的温度。因此,由于环境温度控制措施不当,机房普遍存在机柜局部热点的现象。而机柜中的IT微环境的散热措施不当,是导致服务器过热而宕机的根源所在。据APC公司对中国用户的多项调查表明,因过热问题发生宕机现象已达到了总故障数量的32%。

美国可用性研究中心在2002年提出了NCPI(网络关键物理基础设施)的概念。对于热量管理问题,他们认为,比较科学的解决办法是以机架为单元来控制IT微环境。IT微环境指的是每个机架中的IT设备运行所依赖的环境。我们也可以把这个“IT微环境”理解成服务器内部CPU发热的内部环境。前者可称为机柜IT微环境,而后者则可称为服务器内部IT微环境。只有保证了每个IT微环境的可用性,才能真正提高IT系统的整体的可用性。

1.2传统机房监控系统技术已不适应新需求
  
传统的机房监控技术也存在同样的问题。传统的机房监控系统也与IT设备模块化、机架化的特点脱节,忽视了对IT微环境的监控。而只是对空调机的运行监控和对机房整体环境的监控,不能适应现代机房监控的需求。对空调机运行的监控只能了解空调机是否在正常运行,而空调的正常运行不能说明设备就能正常运行。空调机出风口的温度值更不能说明机房的整体温度和机柜微环境温度,因此对空调的监控不能代表、甚至取代对IT微环境的监控。

1.3传统机房的IT微环境的参数监控有待加强
  
机房各个点的环境参数值是不同的。因此,机房整体环境监测的参数不能视为各机柜的IT微环境参数,更不能体现重要设备内部IT微环境的状况。也就是说,即使机房大环境参数正常,IT设备所在处的环境也不一定正常。机柜内的IT微环境是设备正常运行所需要的物理环境,机柜微环境参数最能体现设备所处的实际运行物理环境的情况,所以对机柜内IT微环境的监控非常必要。IT设备内部IT微环境的运行环境,例如服务器内风扇转速与CPU温度等是最直接、最迅速影响IT设备正常运行的因素。有时候,即使机房内空调运转正常,机房整体环境参数值也在预设范围内,但某服务器却因为某种原因出现服务器内风扇的转速不正常、CPU过热。如果只监控机房大环境,此时机房的管理人员是不会得到这种危险信息的,整个系统就会因为该服务器潜在危机没有得到及时处理而意外瘫痪。

由此可见,现代机房的监控的重点之一是加强对IT微环境的监控。完善的现代机房的监控系统应该是能够实现对从设备内部IT微环境到机柜IT微环境,再到机房大环境这样多层次的监控。

本文地址:http://www.jifang360.com/news/20091010/n93312503.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
更多
推荐图片