机房360首页
当前位置:首页 » 数据中心资讯 » 数据中心连连宕机,损失成本激增,人为失误如何避免?

数据中心连连宕机,损失成本激增,人为失误如何避免?

来源:中国IDC圈 作者:圈圈 更新时间:2018/9/20 9:55:39

摘要:宕机风险,时刻潜伏在身边。

  6月初,北京亦庄某数据中心机房柴油机发生起火;

  6月28日,阿里云官网控制台和使用部分产品功能出现问题;

  7月17日,AWS管理控制台间歇性失灵;

  7月18日,谷歌云平台全局负载均衡服务发生中断;

  7月24日,腾讯旗下云计算服务在广东地区宕机,导致部分用户资源访问失败,控制台登录异常,多家网站无法访问;

  9月4日,它的美国中南区数据中心附近发生了雷击在内的恶劣天气事件,导致了影响冷却系统的电压增加,进而导致其多个Azure服务出现连接问题,客户难以访问储存在中南区数据中心的资源……

  宕机风险,时刻潜伏在身边。

  实际上,局域网(LAN)和数据中心结构化布线组件的安全性和可靠性至关重要。随着业务的迅速发展,世界的联系更加紧密,任何引起停机的故障都可能导致企业收入和生产力大幅下降,并且可能造成客户的不确定性。

  经实践证明,有源组件到接线板的可靠物理安全性在结构化布线行业中难以捉摸。如今已有一系列的解决方案在着手破解这个问题,旨在超越标签标准,其中包括智能修补和端点照明等。所有这些选项都伴随着一些让步,无论是对更多设备的投资、维持系统的工时增加,还是功率密度和其他功能的损失,大多数解决方案都有电气端点照明系统。

  但是,这些可用的选项并没有减少数据中心停机时间的人为失误。由于跳线跟踪和管理的采用率较低,行业中的人为失误并没有减少,网络跳线安全和管理解决方案仍然难以实现。

  停机时间为什么重要?

  网络停机也就是网络无法提供其预期的操作或服务,这仍然是网络管理员面临的严重威胁,其后果可能对企业业务造成严重影响,并可能导致客户对企业的负面看法。

  波洛蒙研究所于2016年1月发布关于网络停机的调查研究表明,网络停机损失增加了38%,从2010年的平均505,502美元增加到2015年的平均740,357美元。调查显示,企业和用户的停机事件造成的损失变得更加昂贵,并增加了企业的网络依赖性,这些表现意味着这一趋势将继续上升。其中损失最高的行业包括金融服务、通信、医疗保健、电子商务以及托管数据中心。但是,所有行业都缺乏一种可以保持功率密度的要求,并缺乏减少空间、材料和人力的开销物理安全解决方案。最后造成的结果是网络管理者和技术人员面临着更大的压力、不确定性以及收入损失。

  人为失误造成的停工

  人为失误是造成网络停机事件的主要原因。信息技术情报咨询(ITIC)2017-2018全球服务器硬件和服务器操作系统可靠性报告指出,“调查结果表明人为失误仍然是计划外可靠性事故的最大原因。”波洛蒙研究所的2016年1月报告表明,由于人为失误导致网络中断的事件从2013年到2016年保持稳定,为事件总量的22%。

  更糟糕的是,人为失误造成相关网络中断的总成本从2013年的380,000美元跃升至2016年的489,000美元,增长了28%以上。这是此次分析的所有根本原因的最大增幅。这个事实将让任何负责网络硬件和安全的人员感到不安。

  在这种情况下,问题是如何发生的?跳线在传统上被视为数据中心的消耗品,虽然许多企业都有强大的跳线管理标签和安全计划,但随着网络跳线数量的增加,以及持续的移动、增加和变化,必须采取主动和艰苦的工作来确保标签满足要求。没有强大的跳线程序会导致对昂贵的有源组件连接到网络的跳线管理松懈。而在数据中心工作人员几乎都有关于贴错标签跳线的故事,而重复使用的旧标签跳线、不可读的标签或许多补丁,使得工作人员难以找到网络链路的另一端,而且很多人都有过拔掉跳线的失误。

  如何降低停机风险?

  事实证明,估计企业网络停机总成本具有挑战性。通常可以计算网络中断的财务影响,但无形的后果可能更难以量化。这些影响可以包括来自客户的负面看法,即对某些服务质量、持续访问和按时结果进行评估和支付。网络中断对客户的影响越大,就越会成为新闻报道热议的话题。

  在市场拥有可行且具有成本效益的解决方案之前,网络管理人员必须保持警惕,保护其网络免受意外中断。

  第一步是估算中断成本,企业可以建立业务,然后平衡网络安全投资与中断相关的风险和成本。

  其次,数据中心技术人员必须对网络资产尽到保护的责任,其中包括管理跳线。采用强大的计划,遵守当前的标签标准,并满足企业的需求。

  此外,企业应实施安全计划,确保所有物理接触网络的人员(包括新员工)接受培训,以了解业务规则、标签方案、MAC工作的布局和程序。

  结论

  针对人为失误、网络停机时间以及提供有效的物理网络解决方案方面,需要行业厂商和用户更多的努力。

  虽然从网络中消除人为失误和材料故障是不可能的,但必须采取更加协调一致的努力来确保物理网络安全性减少网络停机时间的人为失误。在此之前,网络管理人员和技术人员对实施物理安全计划可以防止中断的前景感到担忧,当采用跳线补丁和跳线安全解决方案时,需要在不影响人力和密度要求的情况下提高可靠性和安全性,并减少网络中断的人为失误。

  责任编辑:DJ编辑

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/2018920/n1561108560.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片