机房360首页
当前位置:首页 » 案例解析 » 蒙特利尔银行利用IBM GDPS及STP技术实现快速恢复

蒙特利尔银行利用IBM GDPS及STP技术实现快速恢复

来源:比特网 作者:机房360 更新时间:2009-6-1 15:51:42

摘要:对于蒙特利尔银行这样的金融机构,能够及时从重大系统故障中恢复是一项十分必要的能力。通过BMO的项目实施,GDPS帮助BMO实现了Harris N.A.银行的灾难恢复目标,并且证明该系统能够在比从前更远的距离内运行。

  业务挑战

  通过扩展数据中心站点之间的距离,增强银行的运营弹性

  解决方案

  实施包括GDPS(IBM Geographically Dispersed Parallel Sysplex™)及Server Time Protocol(STP)在内的高可用性解决方案。

  主要获益

  两个小时之内完成灾难恢复,在100多公里的距离内实现零数据丢失的恢复点目标(Recovery Point Objective),并帮助该银行满足合规要求。

  作为加拿大的五大银行之一,蒙特利尔银行“Bank of Montreal (BMO)”是一个业务高度多元化的金融服务机构,2007年时总资产超过3,660亿美元。BMO采用广泛的技术来支持其金融数据的处理,并在IBM系统和软件方面进行了大量投资。蒙特利尔银行通过位于美国芝加哥的Harris N.A分行向美国市场提供服务,Harris N.A.银行的支行数量在芝加哥地区位居第三,资产超过420亿美元。

  对于蒙特利尔银行这样的金融机构,能够及时从重大系统故障中恢复是一项十分必要的能力。2001年的“9•11”事件使得许多企业暴露出灾难准备方面的严重不足,因而美国政府就此发布了一系列全新条例和行业指导方针以应对此类问题。

  《关于增强美国金融系统业务弹性的合理实践跨机构白皮书》(Interagency White Paper on Sound Practices to Strengthen the Resilience of the U.S. Financial System)及其他指导方针就为提升金融机构灾难恢复能力提供了大量建议,包括将灾难恢复中心设在远离主系统的地域以及保证到恢复点数据实现数据零丢失等。

  “该白皮书确实对我们的规划影响颇大,”BMO一位高级技术架构师Malcolm Sanderson先生解释说。BMO通过对其灾难恢复战略实施大规模改进计划来应对这一挑战,而该计划要从构建一个全新数据中心站点开始。

  BMO的运营弹性计划

  该银行原先的备份及灾难恢复(DR)站点距主数据中心不足10公里,这一距离达不到前述指导方针建议的距离要求。为解决这一问题,BMO在100公里以外构建了一个新站点。作为BMO 运营弹性计划“Operational Resiliency Program(ORP)”的一部分,该项目需要实现几个重要目标:增加主站点和备份站点之间的距离;实现零数据丢失的恢复点目标;设立两个运营控制点;并在两小时内完成系统及工作负载的恢复。

  IBM为BMO提供了实现这些业务弹性目标所需的相关技术,并在项目的整个实施过程中予以支持。Sanderson表示:“我们得到了一支非常强大的IBM团队的支持,并在全程获得了他们的协助。”

  STP技术的早期采用客户

  全新数据中心要想获得成功,至关重要的是实现该银行主服务器和备份服务器(共计10台IBM System zTM 大型主机)之间的同步事务处理。PPRC(Peer-to-peer remote copy)技术可被用来实现站点间的数据镜像,有效地使服务器之间的事务处理同步。而GDPS(Geographically Dispersed Parallel Sysplex)则是一种多站点端到端应用可用性解决方案,可被用来实现恢复流程的自动化处理,并管理PPRC环境。

  但是,BMO项目实施中的主要挑战在于两个站点之间的距离较远。GDPS通常依赖于Sysplex Timer®技术。而该技术最多仅支持40公里距离(无中间站点)。可是,该银行的两个站点间需要通过100公里长的光纤线缆连接,其长度远远超过了上述顶限。为了克服这一困难,BMO较早采用了IBM新开发的Server Time Protocol (STP)技术。

  STP技术可保持不同地点间的多个处理器时钟彼此同步,以此增强GDPS/PPRC的性能。该技术支持多站点的协调定时网络(CTN,Coordinated Timing Network),可在100公里内保持System z主机间的时钟同步。BMO是IBM首个在这一距离内通过STP技术实施GDPS/ PPRC的客户。

  为了实施该解决方案,BMO还扩充了其存储子系统的容量,该子系统包括位于主数据中心的IBM System StorageTM DS8300和位于备份站点的IBM Enterprise Storage Server® 2105。此外,他们还必须加快升级IBM z/OS®的版本。

  通过“IBM实施援助计划”(IAP,IBM Implementation Assistance Program),BMO成为了这一方案的先期采纳者,提前使用了极具竞争优势的STP技术,并有机会在开发早期根据自身需求给予相关的详细回馈,从而获得了及时且具针对性的响应。

  可衡量的成功

  该IBM解决方案满足了BMO对于远距离灾难恢复的需求,并且实现了零数据丢失的恢复点目标。“在该项目实施之前,如果发生一次系统灾难,我们会失去若干应用程序全天的事务处理数据,”Sanderson表示,“我们希望实现将所有事务处理恢复至灾难发生的时间点这一目标。”

  达成这一目标需要团队协作,并且需要在实施之前、中期和之后进行大量的测试工作。“我们在实施之前对该技术的方方面面进行了大量测试,”Sanderson谈到,“而这一切是在IBM工作团队的全程协助下完成的。”甚至在新站点开始测试之前,我们已经在实验室环境中已经进行了各种测试,包括在100公里光缆线轴上进行测试,以确保GDPS和STP可以得到全距离的充分测试。

  目前,该解决方案已投入使用,BMO仍继续每年进行若干次灾难恢复测试,以测试该恢复流程需要占用多长时间。“我们的目标是,从启动恢复流程开始算起,两小时内恢复服务,”Sanderson表示。BMO的最近一次测试显示,恢复时间只需1小时54分钟,比目标时间缩短了6分钟。

  “GDPS为我们提供了两小时内实现自动恢复的功能,”Sanderson补充,“它将很多人工操作流程变成自动化,而实现了自动化,恢复速度自然也就提高了。它还会检测可能导致恢复失败的情况。利用全新GDPS系统,一旦决定进行站点接管,我们只需“通知”系统,系统就会自动完成恢复。”

  减少运营风险

  BMO及Harris N.A. 银行从该项目的实施中还获得了其他好处。通过采取灾难恢复战略以满足联邦政府相关指导方针的规定,这两家银行极大地降低了系统恢复失败时,数据丢失所带来的风险。尽管这些运营弹性上的改善,可能很难被该银行客户察觉,但在面临重大灾难时,该机构的信用却得到了极大的保障。正如Sanderson所言,“为业务带来的真正好处是降低风险,我们如今拥有比以前更好的保障策略。”

  “数据保护和信誉风险是我们成功的重要要素,”BMO运营弹性计划副总裁Lee Dunn表示。“现在的业务已经通过各种方式从基于纸张的事务处理演变为电子化事务处理,并且极度依赖于科学技术。PPRC、GDPS及STP技术的实施使BMO能够向我们的内部业务线提供恰如其分的运营弹性水平。”

  “项目团队的重要组成部分”

  Sanderson表示IBM GDPS高可用解决方案团队(IBM GDPS High Availability Team)在该项目中为BMO人员提供了卓越的服务与支持。“IBM已成为该项目团队极为重要的一部分,”Sanderson谈到。“他们与我们的系统程序员并肩工作,一同参加会议、协助规划、当我们在午夜时分进行测试时,他们也会来到我们的测试现场。”

  “他们还做了大量的集成准备工作,”他补充到。“例如,由于IBM与Nortel是合作伙伴关系,所以他们能够与Nortel一起测试GDPS解决方案,以确保一切工作顺利进行。”

  解决方案的延伸

  通过BMO的项目实施,GDPS帮助BMO实现了Harris N.A.银行的灾难恢复目标,并且证明该系统能够在比从前更远的距离内运行。目前,该银行的运营弹性计划已步入下一个阶段,包括把这些同样的技术运用于蒙特利尔银行的应用程序之中。

本文地址:http://www.jifang360.com/news/200961/n7641376.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
  • 上一篇:没有了
  • 相关评论
    正在加载评论列表...
    评论表单加载中...
    • 我要分享
    更多
    推荐图片