客服热线:400-868-5678



您所在的位置:首页 > 新闻中心 > 媒体报道

技术创新优秀案例之一 北京农商银行:三地多活数据中心, 打造中小银行灾备体系建设新模式

2019年03月19日      来源:金科创新社      点击次数:

近年来,随着国家和行业监管部门对金融机构信息系统风险管理的要求不断提高,以及商业银行自身基于防范灾难和风险、保障业务连续性需求考虑,国内银行业相续启动灾备体系建设,建立同城和异地灾备中心,“两地三中心”成为国内银行业主流灾备模式。

“两地三中心”是指同城双中心加异地灾备中心的业务连续性容灾模式,目前国内商业银行普遍采用“大同城、小异地”的“两地三中心”架构。“大同城”是在商业银行所在地建设两个数据中心,通过部署必要的软硬件设备,使所有系统在两个中心都拥有相同处理能力的运行环境,通过数据同步技术,实现生产数据在两个中心之间的实时同步。“小异地”是在商业银行所在地之外一个城市(一般相距几百公里以上)建设异地数据中心,当发生地域性灾难时,以保障银行关键业务在重要渠道可以继续服务、对全行生产数据进行以保护为目的而建立的异地灾备数据中心。

灾备体系建设与管理是复杂的持续性系统工程,投资巨大,且建设周期长、实施难度大。不仅对技术实力要求高,而且考验管理水平,涉及科技战略、IT治理、运维管理等诸多内容。因此,两地三中心建设和运维中通常存在如下问题:一是一些中小银行的灾备建设还处在数据和应用系统备份和恢复阶段,尚未做到有效保障业务持续运行,没有最大限度发挥灾备系统作用;二是一些区域性银行异地容灾备份能力不足,面临“有备份、无切换”的局面;三是灾备中心用于备份的服务器往往处于空闲状态,IT资源没有得到充分有效的利用。

针对上述问题,近年来多活数据中心的概念被引入,成为两地三中心的升级版,灾备体系随之进入新的发展阶段。日前,记者走访了北京农商银行“三地多活数据中心”案例,该项目在农信银资金清算中心主办的“2018年度农村金融科技创新优秀案例评选”活动中获得“2018年度农村金融科技创新技术创新优秀案例”。

“随着集中式架构向分布式架构转换以及云计算的实施,未来海量系统的运维模式之下,对于灾备和业务连续性的要求会越来越高,多活数据中心一定是未来发展的方向。”该项目负责人北京农商银行运行维护中心田野指出。“三地多活数据中心”项目从方案设计到技术实施均为北京农商银行自主独立完成,对于当前处于探索期的多活技术,北京农商银行在方法论和实施经验方面进行了有益尝试,对于农村中小金融机构灾备体系以及信息科技建设具有借鉴和参考意义。

保障业务连续性

北京农商银行按照 “先同城、后异地;大同城、小异地”的总方针,于2015年和2016年先后启动了重要信息系统的同城、异地灾备建设项目,并于2018年7月完成“三地多活数据中心”项目。目前,北京农商银行6个重要业务实现同城两中心双活,柜面应用系统实现两地三中心多活.

“三中心多活的数据中心运行模式,一方面进一步增强了我行信息系统业务运行的连续性、可靠性。在灾备中心冷备的模式下,如果生产数据中心瘫痪,需要两个小时、甚至更长时间才能启动灾备中心,在启动灾备中心的时间里,用户交易会严重受损。‘三中心多活’强化了应用层面的容错和故障处置手段之后,在主数据库故障时,应用可快速把主数据库切换到其他机房的从数据库。另一方面灾备中心建设的投资巨大同时每年运维成本极高,如果资源处于闲置状态是相当浪费的。三中心多活的运行模式把闲置的资源整合,充分利用资源,避免造成浪费。”田野说。

“其项目价值主要体现在三个方面:一是确保业务连续性。业务连续性是指园区级、城市级或地区级发生灾难后,IT系统能够尽快恢复并继续提供服务能力。主要解决和应对火灾、长时间停电停水、地震、战争等灾难事件对IT系统的破坏。衡量连续性水平的主要指标是恢复时间目标(RTO)和恢复点目标(RPO)。通常使用磁盘和数据库同步或异步数据复制,磁带等数据全量和增量备份恢复、应用和网络多点接入、应用系统多写等技术手段,达到不同级别的RPO和RTO连续性指标要求。

二是确保系统的高可用性。系统的高可用性是指非灾难的局部故障情况下,能继续访问应用的能力,需要从基础设施、存储、服务器、操作系统、数据库、中间件、应用系统、运维流程和应急方案等多个层次进行设计。如在基础设施层面对电力、空调、消防、抗震等进行冗余设计;在存储层面采用两套或多套存储阵列构建冗余架构,任意存储出现故障时,其余存储阵列能够提供完整的数据服务;在运维流程和应急层面建立与高可用技术架构配套的运维体系、制度和应急方案,定期演练,从而使高可用架构发挥实际效用。

三是负载均衡性能压力。IT系统容量性能配置决定了IT建设运维成本,合理规划生产、同城、异地站点之间的容量配比,是平衡IT投入与产出的重要依据。为此,北京农商银行基于以上连续性和可用性规划设计思路,对多个数据中心的IT系统进行了统一的容量规划,合理数据配备不同的基础设施、软硬件、运维管理资源,最大限度地提高两地三数据中心之间资源的整体使用率,以节约和控制IT成本。同时在两地三中心被激活多活后,通过集群技术起到负载均衡系统性能压力的作用。”

技术实现的三大特点

建设一个稳定、高效、安全、灵活的多活数据中心,需要对包括业务连续性、高可用性、性能压力、建设和运维成本以及传统数据复制技术和应用多活设计优劣势等因素的多方面考量和分析。

在技术实现上,“三地多活数据中心”主要具备如下三个特点:

1.全局负载均衡设计 全局负载均衡根据站点的健康状况和用户的就近将访问请求智能地解析到不同的数据中心和线路,用户根据解析的IP地址访问业务,将业务均衡地分摊给多个数据中心,同时还根据实际业务承载能力按比例划分各中心分配权重。如在位于同城的北京亦庄数据中心、空港数据中心的互联网出口处分别部署全局负载均衡。通过互联网线路对亦庄数据中心、空港数据中心的业务地址进行检测,根据一定的负载均衡策略,将互联网用户的访问请求解析到健康状态良好的站点。同时,各站点之间实时探测对方健康状态,如发生某一侧站点丧失服务能力时存活的站点需要把业务自动全部接管过来。

2.操作单元封装 操作单元封装是指针对需要在三地数据中心进行的业务操作,封装成独立的业务操作单元,这些业务操作单元在三地数据中心之间是一致的。如果要把用户操作封闭在一个单元内完成,最关键的是数据。为实现操作单元封装,必须确定数据的维度。银行除了用户本身的信息外,还有相关业务产品的数据、账户信息等数据。操作单元化时,走向异地的就是业务的核心链路,所以选择个人储蓄这个维度。但是这样会带来一个问题,当操作其他单元数据时,就无法封闭了,因为这时一定会出现需要集中到一个点去写的现象,所以操作单元封装必须要在路由一致以及业务数据维度都已完全具备的条件下开展。

3.数据一致性 数据一致性依靠数据库、存储和网络技术等要素来支撑,其中基于盘阵技术的UR复制和基于数据库技术的MAA复制,解决了数据中心之间进行远程数据同步的问题。鉴于北京农商银行目前营业网点及客户主要分布在北京市城郊,在三地多活的存储应用中,目前使用建立“一主两从”的存储机制,即三地共同使用同一数据库,确保同步复制的正确性和唯一性。当一地数据库故障或发生灾难性事件时可切换其他可用数据库保障业务持续运行。

推广应用经验

在互联网时代云计算发展的大趋势下,北京农商银行对全行应用系统进行全面梳理和服务水平分级管理,在应用系统两地三中心多活系统的推广中,以柜面系统为切入点,目前已实现了“三中心多活”大集群架构。“亦庄数据中心、空港数据中心和上海异地灾备中心的柜面服务器之间通过软负载均衡的方式形成集群,各中心之间实现操作单元封装,各应用服务器之间互相进行服务侦听探测。网点柜员通过柜面终端随机访问集群中任一台柜面应用服务器进行连接,发起存取款、转账、缴费等交易后,与核心系统、网银系统、第二代支付系统和中间业务等其他信息系统进行通讯。各柜面服务器实现了完全集群化的远程授权任务互相分发、前后台任务互相分发。同时针对集群化后服务器增多的情况,为提升运维管理操作和服务保障水平,提高工作效率,采用三中心一体化运维管理,实现常见运维操作如获取各服务器系统信息、应用巡检、停启服务、版本投产、版本回退、程序备份等的菜单化和脚本化。”田野补充道。

在田野看来,未来银行数据中心需要简单可靠的多活解决方案。北京农商银行“三地多活数据中心”后续将分业务逐步实施,为各项业务开展提供稳定、灵活、高效的技术支撑,助力全行经营转型发展。(李庆莉 冯薇)

上一篇:

下一篇: 

中科汇联承办,easysite内容管理系统,portal门户,舆情监测,搜索引擎,政府门户,信息公开,电子政务