摘要:本文根据用户对正常运行时间的不同要求,比较了容错服务和集群硬件之间的应用区别。 |
容错服务器有冗余电源、冗余处理器和冗余存储。如果硬件发生故障,同步进行的一笔交易可以同时在另一个处理器的系统上进行,交易没有中断。在技术人员解决硬件故障的同时,程序可以在冗余设备上运行。
容错服务器是由专业的公司制造的,这些公司有加利福尼亚州SantaClara市的NEC解决方案美国公司(NECSolutionsAmericaInc.)和马萨诸塞州Maynard的Stratus技术公司(StratusTechnologies),以及惠普的NonStopLine公司(Hewlett-Packard'sNonStopline)。
据NEC的产品和解决方案集成部门的主管BradLightner介绍,容错服务器提供5个9(99.999%)的正常运行时间,这相当于每年五分钟的停机时间。他说,集群硬件平均只有3个9(99.9%)的正常运行时间,这相当于每年有八个小时44分钟的停机时间。集群与容错服务器相比,具有较低的可用性,这是因为只要集群网络的一个节点不正常以及发生故障,就需要占用时间。故障切换需要重新启动应用程序和数据库,这需要时间,而且还存在由于故障而失去数据的风险。
另一方面,冗余的硬件运行镜像应用,它会复制数据。如果一个系统出现故障,另一个系统立刻取而代之。
IdeasInternational在纽约州的PortChester公司的高级分析师TonyIams同意容错服务器比集群能够提供更好的正常运行时间这个说法。他说:“集群确保您的工作量将会被完成,但没有承诺何时回来重新联机。停机时间会因为集群工具、存储管理情况如何以及其他因素的不同而不同。”
Lightner表示,软件应用程序并不适合集群硬件,连接的中间设备本身就可以是一个故障点。据Lightner的观点,供应商之所以推出集群,是因为他们能销售更多的硬件和多个操作系统的许可证,以及可以得到比你为容错服务器付出的更多的额外的费用。
当然,公司需要计算自己的成本方程式,什么是值得的停机时间,以及额外的硬件成本,即集群隐性成本——维护成本。
“管理群集是使用它们的最大挑战其中之一,”Iams说。“集群是出了名的难以安装和管理的,多种运行系统需要更新和修补。图像越多,成本越大。你必须培训你的工作人员,如何管理它们。容错供应商声明可以减少麻烦,他们只提供一个单一的图像给用户。”
但是,并非所有的专家都十分热衷于容错硬件。每个高可用性的方法都有其利弊,这是Illuminata在新罕布什尔州的Nashua公司的分析师GordonHaff的观点。Haff说,容错服务器的最大缺点是,他们从不保护你远离软件故障,因为他们只有一个操作系统映像。此外,现代的服务器基本上都是合理的容错服务器,目前更多的故障是来自软件的。
“如果你安置了一个容错服务器,你正在减少硬件故障,但它不是一颗神奇的子弹,”Haff说。“如果你把微软应用程序的一个任意组合放在一个容错服务器上,那么,现在还不清楚你能减少你的整体停机时间到什么程度。”
然而,Haff承认,容错服务器的确提供了更高的运行时间,即使它是个增量。而这正是该产品的市场蓬勃发展的原因。
“容错服务器在市场上出售,在那里的人们为了逐步提高的正常运行时间,愿意支付额外的费用,”Haff说。
IT专业人员的底线确定了什么是值得的停机时间。如果一些公司可以接受停机时间,那么在这些情况下,集群硬件便会胜出。但是如果你经营一个应急部门、银行或其他一些关键任务的机构,你的群集故障转移等待的秒数,可能会超过你的承受能力。
责任编辑:handsome