机房360首页
当前位置:首页 » 技术解构 » 如何构建更好的备份和恢复以应对未来的挑战

如何构建更好的备份和恢复以应对未来的挑战

来源:机房360 作者:Harris编译 更新时间:2020/7/28 7:03:54

摘要:在这个技术丰富却时间匮乏的世界里,组织真的不应该在低价值的任务上浪费时间。生产力专家通常会建议把注意力放在有效而不是高效上。效率就是要完成更多的工作。有效性是指完成正确的事情。《高效执行》一书的作者Peterf.Drucker说:“没有什么比高效地做那些根本不应该做的事情更无效了。”

    在这个技术丰富却时间匮乏的世界里,组织真的不应该在低价值的任务上浪费时间。生产力专家通常会建议把注意力放在有效而不是高效上。效率就是要完成更多的工作。有效性是指完成正确的事情。《高效执行》一书的作者Peterf.Drucker说:“没有什么比高效地做那些根本不应该做的事情更无效了。”
  
  然而,尽管这些看似常识,很多组织仍然在低价值的任务上浪费时间,而IT部门就是这种情况最严重的领域之一。
  
  IT领域中最普遍的一个特定领域是数据保护,尤其是数据备份和恢复,在这些领域中,人工任务长期以来一直主导着整个流程。最典型的例子是,训练有素的IT员工在工作日内需要驱车15到20公里到达异地磁带存储库备份数据。
  
  这不仅是浪费时间,还是采用的传统磁带存储,其实IT部门可以做得更好。如今已经有了更多提供更安全脱机备份的技术,但许多组织仍坚持这一过时的方法。
  
  不幸的是,备份和恢复往往资源不足并且管理不善。最坏的情况是完全忽略,充其量只是在项目结束时才实施;而导致过时的孤立的产品提供不同程度的功效,甚至不能保证最低程度的弹性。备份和恢复是关键业务流程,不应该是这样。如果方法正确的话,它们可以提供真正的商业价值。但是更好的方法是什么?
  
  需要知道的事项
  
  一个关键要求是作为整体数据管理策略的一部分,并采用一致的备份和恢复方法。而这又需要知道需要保护什么数据,以及至关重要的是保护它的位置,这不是一件容易的事。
  
  应用程序及其数据不再局限于组织的数据中心,几乎可以在任何地方方——台式机、服务器、SAN、分布式NAS设备,以及越来越多的多个云平台,而且,如果没有有效的复制控制,数据可能会大量复制,不仅导致孤岛,还会出现多个相同的副本。
  
  一种解决方案是备份所有内容,但这并不实际,这意味着需要对备份资源进行配额分配和优先级划分。但是,该优先级需要以业务而非技术为主导,并通过提出以下问题来设置优先级:
  
  •如果丢失此应用程序和/或数据,会对业务产生什么影响?
  
  •没有数据,企业能够承受多长时间?
  
  •如何最大程度地减少影响或减少停机时间,或两者兼而有之?
  
  一个过程,而不是工作
  
  另一个要求是观念上的重大转变。忘记备份“工作”和“窗口”,或者使系统脱机以运行备份。如今的技术日新月异,例如,可以在不影响可用性的情况下随时进行实时快照。
  
  同样,磁带具有大量可供选择的替代品,例如可用于内部部署、远程站点或越来越多地在云平台中使用的替代方案,以满足各种需求和预算。此外,现在可以连续复制关键业务应用程序,并在出现问题时可以简单地对整个系统进行故障转移。组织甚至可以购买这种连续和立即的灾难恢复即服务(DRaaS)。
  
  这并不是说应该忘记基本事项。就像3-2-1的备份规则所述,该规则始终保留三个完整的数据副本,两个存储在本地,但存储在不同的存储介质上,另外至少一份异地存储,如果组织使用WORM(一次写入,多次读取)方法保护,那么现在可能会包括云平台。
  
  组织也不应该忘记需要验证备份的一致性、数据合规性和潜在的恶意软件。尤其是,鉴于勒索软件攻击的严重险性越来越高,通常会感染很多已经进行备份的组织。
  
  而且不要认为任何事情都是理所当然的。例如,常见的误解是云计算服务提供商将自动备份云平台中存储的所有内容。这些厂商可能会备份,但是除非组织支付额外的费用,否则无法保证这些厂商能够将组织丢失的数据进行恢复。这同样适用于SaaS产品(如Microsoft 365和Google G-Suite),也适用于更广泛的基础设施平台(如Azure和AWS)。
  
  采用自动化技术
  
  可以说,节省时间的最重要方法是使备份和恢复过程实现自动化。这不仅意味着备份工作的自动化,还意味着尽可能多的备份和恢复过程,不管这看起来有多简单或复杂。
  
  例如,最常见的恢复过程并不是所谓的灾难恢复。它们更可能是单个文件、硬盘或应用程序,因此可以使用自助服务工具实现自动化,从而使请求恢复的用户能够自己执行恢复操作。
  
  另一方面,全面的灾难恢复要少得多,并且很难实现自动化。主要是由于需要恢复多个应用程序、服务和数据源,而这些文件又可能依赖于其他应用程序,服务和数据源,并且可能依赖于不同的平台。除此之外,大多数恢复要求以特定顺序将系统恢复在线状态。
  
  很少有组织能够准确地描绘出最新的环境来演练这样的大规模灾难恢复,因此所涉及的过程应该进行大量记录。但是,在资源贫乏的IT团队中,这种情况很少发生,并且所生成的文档也不可能保持最新状态。其答案就是所谓的运行手册自动化,这是一种日益普遍的工具,可用于单击一次指定恢复顺序并启动所需的恢复过程。
  
  因此有必要回顾一下Drucker的话,有效的缺点是组织经常为其过去而不是未来进行优化。
  
  如果组织不希望自己的未来成为过去,那么需要采用不同的方法。
  
  到了2020年,现在的数据比10年前更有价值。至关重要的是,组织必须更好地了解数据,并了解部门希望如何使用这些数据。这将使组织对需求有更好的理解,这意味着不必专注于对现有流程的部分改进,而实际上可以通过使用使其更加放心、提供更好结果的新技术来产生重大变化并完成更多工作。
  
  无论如何,现在是备份和恢复措施实现现代化的时候了。
  
  编辑:Harris

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/2020728/n6057131489.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片