机房360首页
当前位置:首页 » 虚拟化选型 » 引入实际案例分析虚拟化灾难恢复

引入实际案例分析虚拟化灾难恢复

来源:机房360 作者:许剑 更新时间:2010-5-28 17:02:15

摘要:对灾难恢复项目进程的跟踪、状态的传递和结果的报告是所有灾难恢复项目的重要输出,对于判断IT功能虚拟化所进行的大量投入的效果是非常重要的。

  近年来,很多企业都在面临一大难题,即:如何对他们的基础设施、技术和网络进行灾难备份与恢复,以保证其业务连续性。
  
  一个高性价比的容灾解决方案可以帮助企业以一定的IT投入获得最大的产出,同时很好地保护企业的业务免于灾难事件的影响。
  
  在多年以前的主机时代,很多企业选择建设第二数据中心,以此来平衡生产中心的工作量,并对企业的备份能力进行测试和改进,从而满足业务运营的要求并提供灾难恢复保障。
  
  随着时代的变迁,数据中心的工作量不断膨胀,对第二数据中心的管理和协调也越来越困难。为满足由于业务增长而急剧增加的数据量对数据中心的要求,更大、更复杂的数据中心环境开始出现。
  
  除此之外,众多分布式技术平台和安装在各种层面上的系统软件不断出现,而网络技术的发展也使得“随时随地任意互联”成为可能。
  
  很多企业开始认识到技术已经越来越难以维护和管理,这不仅增加了维持灾难恢复能力的复杂性,也导致了管理一个完全冗余的第二数据中心无法实现,特别是考虑到对财务、运营和技术方面的整体影响。
  
  为了帮助解决这些问题,IT服务提供商引进了多企业共享灾难恢复设施的概念——建设一个配备各种必需技术的综合基础设施,它可以被虚拟地划分为任意大小并进行相应的配置。这一“热站”概念为客户的个性化需求提供了一个资源池,并且全部都由第三方供应商在异地管理,因此可以远离企业的生产中心。这第一次证明了虚拟化灾难恢复策略的可实现性。
  
  灾难恢复基础设施的设计和实施往往是复杂、昂贵并具有挑战性的。虚拟化技术——用于存储和服务器——通过区别于传统灾难恢复的独特方法,可以帮助降低花费,并且提供更多的灵活性和响应性。服务器虚拟化是把整个服务器封装到单个文件中,这使得传送到其它地方变得更加容易。存储虚拟化表现为把多个存储设备作为单一的存储资源,帮助隐藏后端存储设备和网络的复杂性。每种虚拟化技术都可以简化容灾计划的实施部署;一起使用,能够提供非常高效的灾难恢复战略。
  
  对于大多数企业,确定灾难恢复环境的类型,通常需要平衡两个因素,包括一次性和后续花费的总金额,以及需要的恢复时间,从而确保任何的停机时间都是有限的,并且不会对业务产生重大影响。传统的灾难恢复方案,通常需要在另一个站点保留大量的物理服务器,以便使用磁带备份/恢复或者存储复制的方式在两个站点之间进行数据传输。使用虚拟化技术可以有更多的选择,并且可大大减少恢复站点的硬件需求。即使生产数据中心还没有进行虚拟化,你仍然可以在远端利用虚拟化技术,并把物理服务器转换为虚拟机(VMs)。
  
  了解虚拟化方法
  
  从整体上看,虚拟化方法的主要好处是可以通过整合来实现规模效应。大量的服务器、存储和网络集中在一个资源池中管理,并可以按需配置。从灾难恢复的角度来看,当灾难发生时,资源池可以配置更多的容量和网络接入来帮助恢复主要生产环境。虚拟化方法有其独特的吸引力,但还需要考虑很多潜在的因素。
  
  在虚拟化技术下,服务提供商可以在个性化需求的基础上为企业提供约定的资源。为实现对硬件的最大化利用,单一物理设备将被虚拟化为多个分区,从而实现对多个环境进行恢复。同时,这种方式也允许企业只购买其需要的资源。
  
  随着时间的推移,对分布式处理恢复的更大需求越来越明显和必要。企业开始认识到利用软件去装备虚拟机器的技术,这种技术可以在恢复场地的独立硬件设备上进行恢复,同时使得明确和描述恢复过程变得更加容易——只需明确定义备份,以及严格遵守硬件的具体要求即可。假设容量、存储和界面足够充分可以为每个个体提供相等或更多吞吐量,就可以实现大量的虚拟机器恢复到一个物理点上。
  
  多种多样的虚拟化方法
  
  我们将考察多种可以用做灾难恢复战略基础的服务器和存储虚拟化方法。我们的重点是有关VMware公司vSphere的产品和工作方式,其它像CitrixSystems公司的XenServer和微软公司的Hyper-V和它非常相似。根据所使用的虚拟化方法,恢复时间可能相差很大,从几秒到几小时,甚至几天,因此,实施这些方法的成本和基础架构也会有所不同。你所选择的方法可以根据你是想要一个冷、温、热的恢复站点而确定。冷站点与主站点之间没有网络连接,没有或只有有限的硬件。温站点有网络连接、服务器和存储硬件,但通常缺少实时同步。热站点几乎是关键生产系统的镜像拷贝,使用实时同步技术最大限度减少服务中断。从冷站点到热站点的成本和恢复时间有很大的不同,但所有这些类型的站点,通过在其设计和实施的过程中使用虚拟化技术,都可以获得巨大的益处。
  
  虚拟机复制
  
  虚拟化复制工作在服务器虚拟化层,依靠复制软件,可以把虚拟机磁盘文件(VMDK)的所有改变复制到其它主机。需要一个温或者热的灾难恢复站点,具备连接生产和恢复站点的专用网络连接。虚拟机的快照在虚拟化层执行,它会把写到虚拟磁盘的数据转而写到一个单独的增量文件。虚拟磁盘然后会被复制软件挂载,从上一个复制周期以来的任何更新,会复制到灾难恢复站点某个虚拟机的另一个同样的虚拟磁盘。通过新的变化块追踪(CBT)特性,新的VMwarevSphere的vStorageAPI大大改善了这个过程。CBT提供了更快的增量备份和复制,这是因为VMkernel会追踪上次复制以来哪些磁盘块发生了改变。这使得复制操作之间的时间间隔更短,几乎就像连续数据保护(CDP)。这种方法的一个巨大优势是可以在源和目标的虚拟主机使用任何类型的存储。当主站点故障,需要切换到灾难恢复站点的时候,你可以启动灾难恢复站点复制好的虚拟机并开始使用;变化的块会在远程站点虚拟机上接着被跟踪,以便在故障恢复的时候可以复制回主站点。支持这种方法的应用包括:
  
  VeeamSoftware公司的VeeamBackup&Replication把磁盘到磁盘(D2D)的备份和复制结合到了一个产品中。该产品内嵌了重复数据删除技术,并使用CBT达到几乎CDP的效果;在每个复制周期中,变化的块被注入到目标端的VMDK中。
  
  VizionCore公司的vReplicator是一个专门用于虚拟机(vRangerPro是他们的备份产品)的复制产品。它支持CBT和活动块映射(ABM)技术,以检测虚拟机中可以被忽略的空白空间。
  
  PHDVirtualTechnologies公司esXpress也在复制中结合了磁盘到磁盘的备份;可以实现到其它站点简单的全虚拟机复制,或者是增量的块级别的更新。
  
  Double-TakeSoftware公司的Double-TakeAvailability既可以复制物理服务器,也可以复制虚拟机到灾难恢复站点的虚拟主机。复制既可以通过客户操作系统内部也可以在虚拟主机层面实现。
  
  虚拟化灾难恢复策略的要点
  
  在使用虚拟化灾难恢复策略时需要考虑以下要点:
  
  1、恢复容量
  
  制定虚拟化灾难恢复策略的时候很重要的一点是考虑容量。企业通常会认为恢复时容量利用率不会超过100%.事实上,由于恢复的启动阶段会将系统推向极致,所需容量可能会超过生产容量。此外,恢复过程中有大量的跟进工作,这些工作也需要容量。
  
  2、配套资源
  
  恢复能力虽然是需要考虑的重点,但其它各种支持生产环境的要素也要考虑在内。这些要素包括处理器资源(存储、设备界面等)、磁盘资源(存储阵列、存储场地网络SANs、磁盘簇等)、外围设备(控制单元、终端、刀片等)、基础设施(外部交换机)和网络连通性(交换机、带宽等)。
  
  3、资源独立、网络冗余和可测量性
  
  避免灾难恢复失败的一个重点是确保虚拟化资源保持独立,而不需要依赖主生产环境。网络冗余是指不仅为内部用户,还必须为外部用户(如客户、业务伙伴、供应商等)提供接入。可测量性则是处理灾难恢复和生产运营的工作量峰值所必需的。
  
  4、恢复计划测试
  
  制定虚拟化灾难恢复策略非常重要的一点是考虑对计划的有效测试。测试应在系统层面上全面进行,以有效地了解特定时间段内工作量对虚拟化资源的要求,同时验证业务的完整性和基础设施的有效性。虽然局部的功能测试更容易安排,但却无法保证测试结果的真实性,因此会导致测试的效果大打折扣。
  
  5、重设工作量计划
  
  不论是真实情况下还是演练过程中,恢复时都应该制定详细的计划来管理整个过程中不断变化的工作量。该计划应该包括一份高层认可的正式时间表,一份恢复时资源分配的备选工作计划,一个对偏移工作量的日常备份流程,以及一份在备用场地复原这些工作的经过测试的恢复计划。
  
  6、灾难恢复风险控制
  
  在制定虚拟化灾难恢复策略时应考虑到给业务带来的风险。由于虚拟化的固有弱点,距离可能会受到限制,但地理的多样性必须被考虑在内。恢复场所应该与企业已有的风险规避策略所明确的风险承受能力相符,而不应该是满足技术要求的结果。
  
  7、清晰明确的工作量
  
  在确定构成虚拟池的具体资源之前,很重要的一点是要了解灾难恢复的工作量。明确业务的优先次序和临界点,制定出与处理流程、应用的集成和相互依赖性、以及IT支持模块相关的详细计划,从而保证虚拟化环境的可恢复性。
  
  8、保持完整性的规则
  
  包括问题、变更、事件、配置和资产管理在内的严格的系统管理规则是实施任何新的虚拟化灾难恢复策略的前提。这对保持恢复环境的完整性是至关重要的,同时对虚拟化资源池的最终操作、监控和维护的有效性也是至关重要的。
  
  9、业务和IT报告
  
  对灾难恢复项目进程的跟踪、状态的传递和结果的报告是所有灾难恢复项目的重要输出,对于判断IT功能虚拟化所进行的大量投入的效果是非常重要的。
  
  责任编辑:Echo

本文地址:http://www.jifang360.com/news/2010528/n29266722.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
更多
推荐图片