机房360首页
当前位置:首页 » 运维 » 从数据中心投入运营说起

从数据中心投入运营说起

海关总署信息中心运维管理体系介绍

来源:《机房技术与管理》 作者:海关总署全国海关信息中心 寿庆华 更新时间:2011-12-31 9:51:56

摘要:面对不断扩的大运维范围,信息中心将运维的整体目标与包括数据中心运营管理在内的各部分运营目标有效地结合在一起。通过对运维工作的不断思考,运维体系的不断完善,信息中心运维指标在承载业务、服务请求数量均不断增长的前提下,仍能不断提升。改变了以往救火队员的角色,运维水平有了全方位实质的提升。

  数据中心设计与建设是一项艰巨的工作
  
  “数据中心设计与建设是一项艰巨的工作”,每一个参与过中心项目的设计和建设工作的人可能都会理解这句话背后的意义。数据中心建设涉及的工作十分庞杂,对相关人员素质要求极高,从数据中心规划到确定预算,从数据中心标准的选择到设计理念的确定,从位置选择、建筑设计到供电系统、空调系统、监控系统、机架系统的设计与施工,从高安全性到高可用性,从高灵活性到节能性。为了数据中心建成后可以高枕无忧,在建设阶段数据中心的规划与建设者们对这些内容无一不全力以赴地投入了极大地精力。
  
  运行维护期的要求更高
  
  但当数据中心投入运营的日子终于到来时,并不是所有人都能长出一口气。一个数据中心的建设期和数据中心的整个运营周期相比还是短暂的。数据中心投入运营只是迈出了万里长征的第一步,随后将进入漫长的运营维护期。在此期间数据中心的管理者将面临更加严峻的挑战。
  
  最大的挑战还是来源于面对数据中心需求的变化与发展。当今IT技术发展和信息化的速度都非常快,对数据中心容量与技术要求很高。一旦业务量上升,IT设施跟进缓慢,由于前期预见性不足,导致数据中心的再建设,即重复性建设,无论是时间还是人力都会造成巨大的浪费。
  
  其次,随着设备的不断增加,如何控制环境参数、降低能耗、管理设备的维保、管理承载业务应用的信息都对数据中心管理人员带来了很大的挑战。
  
  还有就是数据中心的运营、IT支持如何与整个企业的运营目标达成一致,如何有效地支持企业的运行目标实现。不管是提高承载系统的可用率、降低故障恢复时间、提升业绩还是降低总拥有成本TCO、提高用户满意度等,均需要数据中心的管理融入整体的运营管理,并能满足企业运营对数据中心运维管理的要求。
  
  海关IT运维面临的问题
  
  海关信息化工作起步较早,目前已经历了三十多年的发展。1978年海关第一台国产DJS-130计算机正式投入使用,揭开海关信息化建设的序幕。1988年3月,海关报关自动化系统(H883系统)立项,其目标是利用电子计算机辅助决策技术对进出境货物管理全过程进行管理。H883系统在全国海关推广应用,随后成为通关作业改革的平台,在便捷通关、无纸报关中也发挥了重大的作用,取得十分可观的效益。1999年11月,新一代通关管理系统(H2000系统)立项,通过该系统,海关建立起全国集中式的业务数据库,统一存放各地海关的各项业务数据,可随时调用,使企业在办理各种跨关区进出口业务时享受相关工作便利。采用该系统后,有效解决了转关手续繁杂、时间长等问题,可以随时调用业务数据,提高了转关速度。2009年4月,现代海关综合管理系统(H2010系统)立项,实现海关信息系统全方位的升级和发展,建设耳聪目明、科学决策、安全稳定、支持有力的“智慧海关”信息化服务体系。经过多年的发展,在监管、征税、打私和统计四大职能管理方面建设了数量众多、覆盖面广泛的信息系统群。
  
  全国海关信息中心是海关总署在京直属事业单位,成立于1986年,主要承担海关总署机关和海关系统的信息化建设工作。服务于全国41个直属海关、800多个通关业务现场、海关总署各司局、20多个政府部门、20多万家进出口企业。信息系统的运行过程中,我们时时刻刻面临着各种各样的挑战。2010年承载运行应用项目达317个,年处理客户服务请求62098个,日均业务报关单量15万份,日均税收32亿元。
  
  由于海关业务特别是海关监管非常复杂,通关规定包括有关商品的规定、企业的规定、运输方式的规定、减免税的规定、地区优惠的规定等等。而每一类规定又垂直细分,最复杂的是这些规定和条件之间又相互交叉、错综复杂。在承接运行初期由于缺乏运维管理的必要手段、运维管理可视化程度不高、信息系统的管理和服务分散、缺乏统一集中的运维支撑工具等多种原因,随着用户要求越来越高,业务越来越复杂,管理要求越来越高,为海关执法通关、风险决策、统计分析等多样化业务提供高保障的信息化支持难度不断加大。
  
  同时,由于以上条件的限制,中心内部各职能也无法对总体的运维目标进行有效地支撑。以信息中心的机房管理为例,存在如下的问题:机房相关的巡检、维保、设备安装等大量信息存于纸面或电子表格中,难以查找和使用;管理涉及多个部门,缺少流程、规范的约束,管理环节难以支持;相关信息展示不直观、不透明;传统的信息管理方式无法支持决策分析。在这种情形下就出现过,机房临时需要关闭设备时不知道设备上运转应用的情况,不知道关闭设备会对业务造成何种影响的状况。这些落后的管理方式,都对当时中心的发展造成了一定程度的影响。
  
  海关IT运维解决方案
  
  运维发展
  
  信息中心的运维管理实践之路是因时而变、顺势而动的结果。多年来,信息中心努力贯彻落实“运行保障是第一要务”的管理理念,在运维管理方面进行了许多有益的探索,对运维工作的实质和内涵展开了深入思考。积极推进由“急诊大夫”到“保健医生”的转变,采用有效的方法,做到持续改进和防患于未然。信息中心的信息系统运维工作伴随着海关信息化建设的发展历程,经历了初创期、建设期和全面提升期三个阶段。
  
  一、初创期(可比喻为急救中心):1998年至2002年,为适应H883通关系统(分布式系统)在全国海关的上马需要,信息中心成立了专职运维服务部门,设立了海关内网技术热线,迈出了运维工作的第一步。提供热线受理外部海关用户报障及技术支持服务,根据情况调集技术人员抢险处理。在初始阶段初期,内部主要存在的问题包括故障频发、不可预期,而可以用来支持的资源有限,调配也很困难,整体来讲处理效率低,规范少、风险高。这个时期对于外部业务有一定的影响,会对业务造成损失。通过组织流程和技术实现两方面入手初步实现了事故管理,但运维的局面还比较被动,客户满意度低。
  
  二、建设期(可比喻为社区医院):2002年至2007年,H2000通关系统上马,转为集中式信息系统,通关作业数据在信息中心集中处理,运维压力(包括基础环境保障、技术支持、运行监控等)显著增加,在“保障运行为第一要务”的宗旨下,对应的加大了资源投入,随之而来的管理复杂度、难度也逐步提升。在建设阶段初期,内部问题主要集中于如何预测风险,防患于未然,内部机制如何更有效的运作降低风险。中心扩充力量壮大运维保障团队,形成了专业化分工的三级支持体系,信息中心以H2000推广应用为契机,适时引入IT服务管理标准,建立起运维管理流程,完善了事故管理、实践落地了变更管理、问题管理一系列ITIL管理流程,IT运维工作(常规监控、客户服务、系统网络运行、机房管理等等)开始向规范化、精细化、专业化方向发展,能够有效承担不断增加项目的运维保障工作,随着管理的不断深入,应对运行风险的能力、处理效率逐步增强,各项运维管理工作逐步趋于有序化、常规化。此阶段考虑到IT运营对业务的影响,但还没有技术手段辅助实现。运维局面逐步平稳,但运营的成本还相对较高。
  
  三、全面提升期(可比喻为综合医院):2007年至今,为实现全国海关一盘棋运维管理要求,提升科学规划、合理分配,决策分析、质量评估、风险评估的能力,开展了资源整合运维体系化建设工作,不断完善流程制度(实践落地了配置管理、发布管理流程,实现了ITIL服务支持的五大流程的整体应用)、信息化支撑载体,综合管理水平稳步提升;同时为进一步提升IT运维对业务的价值,提升服务品质和满意度,开始从面向技术到面向业务的转型,加快IT与业务融合,实现服务水平管理的科学化和精细化,谋求以较低成本实现较高的服务管理目标。在多年推行“以流程为导向、以客户中心”的管理思路过程中,逐步构建起信息中心的运维管理体系,包括组织管理体系、制度流程体系和运维支撑平台的运维管理体系框架。
  
  组织管理体系
  
  健全的组织管理体系,是运维工作顺畅开展的基础。“人”是运维工作的规划设计者,同时也是运维工作的实际参与者,在运维服务中发挥至关重要的作用。为切实履行运维管理职责,加强专业分工,信息中心先后设立了网络与信息安全保密部、客户服务部、常规运行部、系统管理部、网络通信部及技术管理部等专业运维部门,各部门各司其职、协同配合,共同承担包括运行监控、热线服务、系统维护、网络管理及安全保密等运维管理职能。并建立了以厂商为主的三线服务支持,使组织管理体系更加完整,支持更加有效。
  
  制度流程体系
  
  为进一步提高运维管理水平,规范运维管理工作,信息中心适时引入业界IT管理最佳实践——ITIL管理理念,结合实际,稳步推进流程化建设,先后建立起故障管理、变更管理、问题管理、配置管理及发布管理等运维流程。
  
  中心还很注重将ITIL管理理念与开发阶段引入的CMMI模型、信息安全ISO17799等标准相互融合,以共同构筑了海关核心系统的安全运行坚固防线。近几年,中心运维管理面临着向更高层面转型的要求。如何反映基础架构和业务服务之间的关系,了解IT对业务的影响,成为我们更加关注的问题。鉴于此,中心于2008年起逐渐转换管理视角,由专注IT资源稳定运行能力转变为关注于业务连续性保障能力建设,逐步将运维工作重点放在了向业务的集中监控转型方面,为“业务持续性管理”提供支持。
  
  运维支持平台

  
  为支撑运维管理中的各项工作按照规定的标准、流程有序开展,实现运维工作的可视化、可控化及自动化管理,中心逐步建立并应用了多个运维支撑平台。这些支撑平台将机房、系统、网络、数据、中间件、应用、账号等信息系统相关资源作为管理对象,以“监”、“管”、“控”三个方面来组织功能,支持运维管理的各项工作。
  
  2002年,为从根本上解决人工监控的不足,开发了第一个集中监控系统,并逐步应用了各类监控工具,实现了运行监控的自动化;其后逐步建设了呼叫中心、服务台、常规运行管理系统、运维流程支持系统、机房信息管理系统等。
  
  常规运行管理系统实现了监控预案的管理,并提出了监控配置项的概念,建立了监控有效性分析的机制,可以对设置监控点有效性进行评估,形成了监控层次的持续改进机制。机房信息管理系统,实现对IT设备及场地设施全生命周期的管理,并对机房布局及机架安装情况进行直观的展示,结合配置库可对机柜运行应用项目、业务的情况进行分析。这些运维支撑平台实现了对热线服务、运行监控、重要基础设施的全方位管理,并为运维管理的监督、评估和考核提供了依据。
  
  随着运维平台的逐渐增多,各平台间的信息交互、资源共享问题也随之而来。因此,中心近两年致力于信息化运维资源的规划整合:一方面在集中监控系统基础上,建设海关信息系统安全运行管理平台,运维监控资源的集成,并通过构建业务影响分析模型,实现面向业务的监控转型;一方面通过建设中心服务平台,在对中心服务及可利用服务资源进行整体性、深层次挖掘与规划的基础上,推出了统一的业务服务门户。
  
  建设经验
  
  “监、管、控”的持续改进
  
  监、管、控是一个运维领域里比较熟悉的概念。监控是我们的眼睛,帮助我们透视和认清网络、主机、应用等整个IT环境,是我们的情报来源;流程管理是我们的大脑,帮助我们思考、制定决策和完成流程控制和管理,是我们的情报分析和决策中心;控制是我们的双手,完成自动化批量处理,是我们的实施力量和手段。
  
  由眼睛观察情况,然后由大脑决策,最后由我们的双手执行,眼睛又能看到双手执行的效果,三者形成有效的反馈机制。三者相互作用,地位却又不尽相同。监、控相对而言更加依赖于技术条件,而管理对于处于不同发展阶段的组织,选择合适的管理方式、制定合适的管理制度与流程都能获得很好的效果。因此对于一个组织而言,如果三方面不能做到同样的水平,或是无法投入同样的精力,应先提高“管”的水平,提高“管”的意识,以“管”的提升带动另外两方面。同时管理水平的提升,会直接带来对另外两方面的需求。只有另外两方面得到提升,管理的内容才能够落地,它们之间是相辅相成的关系。以信息中心的实践经验来讲,管理是还是处于主导地位的,另外两方面适应管理的发展才能获得较好的效果。而在有些实践中,有些组织却是反其道而行之,寄希望于通过采购一些在“监”与“控”方面做的比较好的产品,从而提高“管”的水平,进而提高整个组织的运维水平。个人认为这个思路很难取得良好的效果,更多的会陷入进退两难的境地。
  
  工具的选择
  
  谈到工具的选择,这方面也有很多需要注意的内容。首先,需要选择合适的产品,也就是选择适应根据“管”的需要与当前水平来选择工具。在工具选择中特别需要注意的是要避免“拿来主义”,工具是与相关管理水平与要求相适应的。看到别人的工具好,直接照搬过来不一定适合自己,也不一定能达到提高整体运维水平的目的。选择工具同时需要工具有定制的空间,在别人的基础上结合自身的管理特色,最终形成适合自身的管理工具。这里也需要注意,有时自定义功能是柄“双刃剑”,在获得较大自由度的同时也会带来日后升级、维护的成本。如何来权衡二者的关系,是一件考验管理水平的问题。第二,选择的工具需要能够支持把管理落地,否则“管”有可能成为“空中楼阁”,无法达到目标。第三,工具的使用要使用好。很多产品功能很多,演示起来很花哨,但是实际的选择过程中,需要透过迷雾找到其中有效益的特性。根据这些特性作为工具选择的依据,而不是看工具包含了多少功能或者赠送了多少的内容。在整个的运维体系中,会存在多种的工具,这些工具各自解决不同领域的问题。如果想充分发挥各自的效益,必须要做到工具间的互联互通。有些工具处于保护的目的,对自身增加了重重的防护措施,诸如数据库加密等等。这些措施本身无可厚非,但不可避免的会对工具的使用以及工具的互联互通造成一定的影响,工具的选择中一定要考虑到这些因素。
  
  面对不断扩的大运维范围,信息中心将运维的整体目标与包括数据中心运营管理在内的各部分运营目标有效地结合在一起。通过对运维工作的不断思考,运维体系的不断完善,信息中心运维指标在承载业务、服务请求数量均不断增长的前提下,仍能不断提升。改变了以往救火队员的角色,运维水平有了全方位实质的提升。
  
  责任编辑:kelly

本文地址:http://www.jifang360.com/news/20111231/n226432888.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
更多
推荐图片