机房360首页
当前位置:首页 » 应用安全 » 在灾难恢复计划期间经常被遗忘的10个经验教训

在灾难恢复计划期间经常被遗忘的10个经验教训

来源:企业网D1Net 作者:Harris编辑 更新时间:2018/12/13 7:30:07

摘要:人们并不知道下一场灾难将以何种形式何时到来,但确实知道未来会有灾难。无论情况如何,与灾难恢复相关的服务周期是至关重要的。无论企业是使用传统的灾难恢复产品和流程,灾难恢复即服务(DRaaS)还是其中某种组合,都会获得一些重要的经验和教训,可以从中学习。

   人们并不知道下一场灾难将以何种形式何时到来,但确实知道未来会有灾难。无论情况如何,与灾难恢复相关的服务周期是至关重要的。无论企业是使用传统的灾难恢复产品和流程,灾难恢复即服务(DRaaS)还是其中某种组合,都会获得一些重要的经验和教训,可以从中学习。
  
  企业的大部分智慧来自系统架构师,以及那些以灾难恢复即服务(DRaaS)为职业的工作人员。DougTheis就是其中的一位研究人员,他是一家实验室装备厂商的市场战略总监。这里提出的许多观点都是基于Theis对于客户端“疤痕组织”的体验。
  
  1.灾难还没有结束,直到恢复10周之后
  
  企业的业务将经历警告、事件及其弹性持续时间,事件后果与恢复等过程。最后是实际的恢复,而无论其正常情况如何。例如,洪水泛滥损坏企业的设施和设备,并且也摧毁了员工的家园;而供应链中断,并在适应和调整中恢复。即使企业具有备份和冗余的电力和管道,食品和其他资源可能会受到限制,直到获得新的供应。企业的计划不仅要反映灾难的事件周期,还要反映供应链和物流的本地化恢复。这可能需要数周甚至数月的时间。重要的是要记住,当红十字会等救援机构离开时,企业也不一定会恢复正常运营,而是在那之后几个星期才可能恢复正常。
  
  2.法规和合规性法令仍然实施
  
  虽然在报告和审计师的建议中可能提出一些宽松的措施,但是在灾难之前、期间和之后,企业仍然要遵守相同的监管要求。企业在从灾难中恢复过来的同时,减少监管可能是很诱人的因素,因为没有合规通行证。
  
  3.测试不是可选的选项
  
  即使是最好的计划也需要测试。执行灾难恢复测试需要支付费用,而且需要一定的时间,但除非企业已经完成了真正的演练,否则无法证明资产和计划的价值。企业需要记录哪些有效,哪些无效,以及为什么提供有关如何实现业务连续性以及成本的多方面的见解。每一次测试都是一个平息未来的破坏和灾难的新机会。
  
  4.跨学科的连续性计划需要组织的DNA
  
  如果企业中的每位员工知道在事件之前、期间和之后做些什么,那么更有可能在灾难中生存。不幸的是,在许多公司,灾难恢复计划是一种部落知识,也就是说当企业员工改变工作角色或辞职时,这种知识可能消失。部落知识是非常宝贵的,但也必须代代相传。确保灾难恢复计划具有详细记录,有目的地分发(包括确认收据)并定期更新。此过程还需要习惯性地更新灾难恢复资源和多次操作(总是更新辅助环境)。这种习惯需要存在于企业的DNA中。
  
  5.灾难恢复是一个全有或全无的主张
  
  资源重复不会带来即时保护。更重要的是,IT是业务连续性的一个要素,灾难恢复计划不仅仅是IT团队的工作。事实上,如果企业的各个团队没有全部参与和加入,那么该计划就会从一开始就存在缺陷。
  
  那是因为组织无论规模多大,都很复杂。如果规划人员没有考虑和容纳所有人员、流程、供应链、物流和产品的方式来编写灾难恢复脚本,那么在计划付诸行动时可能会出现差距。IT团队经常引导灾难恢复计划,但所有利益相关者应该领导更大的业务连续性工作,IT与该方法保持一致。这不仅仅是IT的连续性,还是业务的连续性。
  
  6.故障恢复通常比故障转移更复杂
  
  Theis表示,除非对计划进行全面测试,否则大多数组织都无法清楚地了解恢复所需的工作量。“即使他们参加测试,他们并不总是了解,例如实际上恢复多久了?关键点在哪里?哪些IT人员有资格这样做?”他说,“平庸的故障恢复模型只是某个地方部署的另一些装备而已。它们经常没有得到充分测试。与其他40个项目相比,其价值很低。”
  
  Theis补充说,“当故障恢复没有得到充分测试或理解时,故障恢复经常成为无谓的努力。真的想在凌晨2点面临失败吗?那一刻真的想清楚了吗?知道这意味着什么吗?”
  
  真正的循环模拟至关重要,特别是因为故障恢复通常比故障更复杂。
  
  7.同步=成功
  
  如果组织的应用程序不同步,他们可能会在最糟糕的时间之前知道这些事情。作为每次故障转移和故障恢复演练的一部分,组织应检查同步工作是否完成,并且业务完好无损,以便在故障转移和故障恢复期间不会出现业务中断。缺乏同步,故障转移和故障恢复都不会起作用,因为工作的IT基础设施的前提已被打破。
  
  8.连续性计划永远不会继续存在
  
  “采用DIY灾难恢复的公司通常会有5年的连续性计划,但可能放在一个不起眼的办公室的货架上。”Theis说。特别是在这个不断变化的技术和商业考虑的时代,更不用说兼并和收购以及其他重大事件,其计划必须定期更新和审查,并不断记录变化。
  
  9.依赖性决定计划
  
  大多数组织在开发、测试和执行灾难恢复计划时,主要考虑两个IT类别——顶层和其他所有东西。但人们往往会忘记这些类别包含哪些类别,理解每一层中的依赖关系非常重要——也许比其他任何事情都重要。而这些依赖关系的准备工作是艰巨的,但需要以对业务有意义的方式进行故障转移和恢复,并得到灾难恢复计划、产品和人员的支持。
  
  10.企业确实需要人才
  
  在灾难恢复规划过程中,交叉培训员工和随时可以访问的计划是灾难恢复计划过程中的关键步骤。例如,在实际灾难恢复过程中,可能无法提供具有移动性或儿童护理/依赖性护理需求的人员。那些可以提供帮助的人需要遵循一个脚本。灾难情况下的员工也需要同情心:人们可能在与灾难相关的压力性职业环境中工作,并且灵活性也很重要。
  
  编辑:Harris
  

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/20181213/n9943114139.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片