IBM信息归档与保持解决方案 |
|
|
|
|

IBM存储解决方案部存储架构师段广宇
大家好,很高兴有机会跟大家做交流。我今天跟大家交流的题目是交通银行境内外一体化的存储体系的建设和管理。
我想分四个方面跟大家做一下交流。首先是谈一下交通银行的基本的情况,然后谈一下交通银行信息化建设的情况,第三个方面就是我们面临的压力和挑战,第四个方面就是重点谈一下我们的境内外一体化存储体系的建设和管理。
交通银行是1908年成立的,当时是光绪34年,由光绪皇帝亲自批准成立的交通银行,它是我们国家现在成立的最早的一家全国性的大型进行。那么在近代的中国金融史上占有重要的地位。今年2008年是交通银行成立100周年,我们行在四月份的时候,展开了一系列的百年交行的庆祝活动。那么在1958年交通银行除了香港分行以外的,仍是以交通银行的名义来对外营业以外,交通银行的内地的业务又分别并入了人民银行和人民建设银行。后来在1986年国务院决定重组交通银行。1987年的4月1号,重新组建后的交通银行正式对外营业。那么交通银行在发展过程当中有很多第一。
首先是新中国成立以后第一家全国性的股份制商业银行,第一家登录国际资本市场的商业银行H股在香港上市,而且是2010年世博会的全球合作伙伴。在全球1000家大型的银行里面的排名名列68位。那么我们行在上个月3月20号的时候,发布了2007年的年报,年报显示截止到去年年底,我们行的总资产达到了2.1万亿元,比年初增长22%,净利润是202亿元,比年初增长了65%。我们行也被英国的银行家杂志评为中国最佳的公司治理银行。我想简单地就是把我们交通银行的情况跟大家做一个报告。
下面我谈一下信息化建设的进程。从总体上我们行的信息化建设有三个发展阶段。一个是基于微机的网点业务处理阶段,一个是基于小型机的同城业务处理阶段,最后就是基于大型机的全行的业务集中的处理阶段。在这三个阶段中,由于我们行原来是一个扁平化的管理的银行,所有的分行都直接向总行汇报,所以我们基于小型机的同城业务处理阶段到大型机的全行业务集中的阶段,是走了一个非常坚辛的一个过程,我们经历了四年的时间,从2002年开始将近百家的数据中心或者叫运营单元把它一一合并,最后在2006年的时候收归总行。也就是在这样的一个历史背景下,交通银行的数据中心就在这样的一个背景下成立了,那么2002年的2月份,交通银行数据中心正式地运转。那么到了2006年的8月份,也就是2002年到2006年的8月份,我们行的所有的全国性的业务都已经集中到了总行数据中心。
然后我们并没有到此就止步,在2006年的11月份,我们又把我们行的纽约分行、首尔分行、东京分行和新加坡分行这四家分行上收到总行数据中心。那么在去年11月份和10月份,又把澳门分行和法兰克福分行业上收到总行。那么在今年的3月22号,又把最后一家香港银行也上收到总行。也就是到上个月为止,我们交通银行所有的境内外的业务,都在数据中心运转,这是前三个阶段。最后一个阶段就是我们目前正在做的和未来将要做的就是两地三中心的信息系统的基础架构的进一步的建设。
交通银行有一个非常完善的IT治理架构,首先有一个真正意义上的CIO,首席信息官,他来负责我们行的整个信息技术的策略的制订、资源的调配、流程的管理。那么在首席信息管下面呢?总部有三个主要的部门,一个部门就是信息技术管理部,他来负责我们行的一个全行的、分行的业务的管理。软件开发中心是负责全行性的软件的开发,数据中心是负责全行的生产系统的运维,包括一级骨干网的建设,包括各种技术规范的制订,包括像基本的操作系统中间件、数据库的这种搭建,还有整个设备、机房环境、风险控制、信息安全等等,还有整个的新产品投产,都是在数据中心。
那么全行的整个的IT的人数呢是在1400多人,占全行总员工的比例是2.1%现在,总行从事科技的人员是在300多人左右。
那么我刚才提到了交通银行的这种集中运转的模式,实际上不光包括交通银行传统的海内外的业务,而且还包括了交银集团的各项的业务。因为我们在随着混业经营、多元化经营这样的一个背景下,那么交通银行交银集团相继成立了交银国信、交银证券、交银租赁等等这样的一个全资子公司,目前就是投资证券租赁的这样一些业务,也在数据中心来运转,实际上这个数据中心是为了交银集团的业务发展来提供支撑。
另外我们在跟海外的汇丰银行有一个非常密切的战略合作。比方说我们有境内外机构的统一的联动快汇业,总体上讲我们现在是有七家海外行、一百家分行,一共是两千七百个网点,再加上各子公司未来还要把交银施罗德,还要成立交银保险,都要集中在一起来运转,是这样的一个大致的情况。
那么我们行我感觉一个比较大的优势在哪儿呢?一个集中的后援支撑体系。我们在上海的浦东新区金融信息服务产业基地那个园区里面,我们有一个160亩10万平米的这样一个园区,在这里面有数据中心、软件开发中心、业务处理中心、培训中心还有档案中心,所有这些中心都在一起运作,这样一个集中运作的模式,我感觉是非常有利于对事情的解决、问题的沟通和相关的工作的推进。
你比方说这个是我们的数据中心,这个就是开发中心,从数据中心到开发中心也就两到三分钟的时间,相对于国内有一些比较大的这些银行的机构,它的开发和运维相差千公里,每一次要去做工作都是沟通上确实有一些问题。另外像我们的业务处理,业务处理很多比如说我们的资金后台,还有国际业务大小额支付等等都是在业务处理中心来运转。那么所以从技术的角度来支持业务的发展也是非常有利的。同时由于整个园区又是有着非常集约化的这样的统一的管理。你比方说整个的后勤、住宿、餐饮都是在这个园区统一来解决的,所以也就是解决了很多作为后勤保障技术人员的后顾之忧,所以这方面我们感觉是非常非常有效的这样一个运转模式,也支撑了我们这样一个快速的发展。
那从技术体系架构方面谈一下。我们实际上始终是坚持了一个服务器虚拟化的这样一个系统架构模式来看,我们在2002年的时候引入了IBM的大型计算机系统,它的目的就是使得服务器虚拟化。还有就是包括开放平台的,主要是包括IBM的小型机、HP的这样的一些主流的小型机,它的克拉斯特的结构,从前端的路由器到WEB到APP整个的这个动态负载均衡,使得我们主要的、主流的这样一个架构,能够实现我们所说的四个特点。也就是第一个叫高可用性,第二个叫可扩展性,第三个是灵活性以及第四个是可管理性这样四个特点。那么也是因为我们有这个比较灵活的架构,我们在2005年数据大集中系统平台设计与建设这个项目,被评为人民银行2005年的科技发展一等奖。
那么在应用架构方面,我们有一个非常清晰的总分行的这个应用架构,这个图中的红色部分我们是已经投产的,面向服务的SOA的应用架构,SOA现在确实是很热的一个话题,那么也是因为确实是非常实用地采用了,非常有效地采用了SOA的架构,这个我们就是基于SOA架构的综合理财产品平台,获得了人民银行2007年的科技发展的二等奖。那么图中的蓝色部分是因为在此期间更早地完成了这项工作,也获得了交通银行并行耦合技术架构下的全功能综合业务系统的人民银行评价的科技发展一等奖。有幸也是作为科技发展奖的评审组的成员,这个组也确实是非常不容易拿到的,因为每一年包括工、农、中、建、交通银行,还有一些商业银行,共同每一年的这样的项目,会有八十多个项目,那么一等奖也就是两个、最多是三个。我觉得我们取得这样的成绩也是付出了很大的努力。
那么对于刚才谈到的这个总行的部分,我们是以核心帐务系统为一个枢纽,那么在它的外面是有,比方说国际业务、信贷管理、基金、客户信息等等的外围系统。那么所有的业务逻辑都是在这个外围系统实现的,主要的帐务处理都是在这个核心帐务系统里面去做的。那这样就是非常使得我们这个核心系统相对来讲就比较稳定,主要是做一个帐务处理。
那么在信息化管理方面,我们也是一直在加强,这个企业或者这个IT它是否强大,它是否有这个发展后劲,规范化的管理是一个重要的方面。所以我们在一开始的时候就很重视。那么软件开发中心是在2005年成立的,也就是在2006年的年底的时候,就通过了认证。数据中心是在2006年成立的,我们经过了2007年一整年的努力,获得了ISO20000的认证,ISO20000是一个最佳实践。我想右边这张图就是大致谈了一下什么是ISO20000,就是可以分为前端和后端两个部分,前端的部分主要是定义和管理客户的需求,对客户的服务是如何进行的。那么它是以这个服务水平协议为核心的,包括业务关系管理,比方说这个客户满意度、投诉,包括这个服务报告。比方说我们是每个月都要给这个业务部门和分行要发服务报告的。还有供应商的管理,尤其是对于供应商的这种服务的响应速度、响应的级别、服务的有效性我们做一个非常明确的规定,还有安全包括物理安全、系统网络应用的安全,人员的安全、合规性的安全等等。还有包括容量管理,后面我还要谈一下包括预算、可用性、可持续性等等,这一系列的管理都是面向于服务的,面向业务的服务的。那么另外一个方面就是对于后面,就是我们作为数据中心内部的管理,如何在流程上加强控制,使得这个流程更规范、更标准化。因为这个从传统上讲各个IT部门呢是一个职能型的部门,这个条块分割比较严重。那如何通过流程来打破各个部门之间的这种壁垒?使得它们有效地结合起来,是以这个配置管理为核心的。包括事件管理、问题管理、变更管理、发布管理。为了使得这样的一个流程达到一个非常有效地运转,我们是在每个流程都设置了流程经理来推进这样的一个流程的建设。那么仅仅是这样一个流程还是不行,还要有这样一个工具来把它固化下来,使得大家都去遵守,所以我们有这个全行应用的这个IT服务管理平台,在软件开发方面有这个软件开发的平台。统一的平度防范体系还是产生很大的作用的。
我想前面是谈一下IT的这个信息化发展的过程,第三个方面我想谈一下IT面临的压力和挑战,主要还是生产运行方面的。首先是业务量的爆发性增长给容量管理带来非常大的压力。2007年我们贷记卡、网银、基金还有第三方存管这样的一些,这样的业务由于资本市场的火爆,还有我们自身的发展的一些特点,使得我们的业务量的增长都达到了200%以上,所以呢这个,因为有的时候本身的应用它的设计容量就达不到我们实际的发展容量,还有本身设备容量的一些限制,所以有很大的压力。
另外就是创新业务和综合经营带来的系统架构所带来的这种新的挑战。因为交通银行即将成为股指期货的特别结算会员,股指期货的推出将对我们也是产生一个非常大的压力。因为期货这个跟传统的银行业务相比是非常不一样的。无论是它的运作模式还是它的这个系统架构,都跟传统的银行的系统是不一样的,我也不太熟悉,在这方面有很大的压力。另外就是银行自身的一些基础性的架构的变动,你比方说我们的集中式的客户信息系统、流程银行还有这个内容管理方面的内容,也是给我们的这个架构带来一个非常大的冲击。还有呢就是多元化的、综合化的经营都不谈了,这也是有很大的,因为它是有很多异构的,尤其是包括这个租赁,今天租飞机、明天租轮船的,它的每一个都非常独特的这种定制方式,给我们运维还是有很大的挑战。
第三个方面就是全球化的运营,要求全天候地不间断地服务,正是由于我们这个挂接了海外分行,由于有时差的关系,纽约的白天就是我们的晚上,这里边不存在晚上不重要的,毕竟我们如果没有挂海外分行的时候,毕竟半夜的时候还是运维的支持力度还是比白天要差一些的。但是正是由于海外分行有时差的原因,那么这种停机的时间、停机的机会就越来越少,包括我们这个硬件的升级、系统的补丁这个方面就,给我们的计划性停机的时间机会就几乎没有,所以在架构上如何设计得非常高可用,是我们面临的一个非常大的挑战和压力。
另外呢就是由于有了这些海外分行,因为海外分行他要允许我们挂接到这些,把这些海外分行的业务都挂到这个总行来,就一定要满足当地的监管机构的要求。你比方说像香港经管局,纽约监管当局还有一些别的监管当局,未来我们还有一些其他的分行、海外分行,那它的监管要求,你是必须要满足的,你如果不满足它是不允许让你来挂接的,所以这也强迫我们要达到最高水平的那一个监管要求。
第四个方面就是灾难备份和一体化运营方面的压力。人民银行在二月份的时候出台了一个银行业信息系统灾难恢复管理规范,里面对于灾难恢复的策略、具体的实施步骤都有非常明确的要求,我们拿到了这个规范以后,也是仔细地研读了一下,里面对于一些具体的要求,比方说它最重要的系统,比如说RTO要小于6个小时,RPO要小于15分钟,而且每年应该至少组织一次演练等等,都有非常明确的要求,这样给我们也是带来了一个非常大的压力。因为上周我们还跟银监会的信息中心的林立副主任我们在一起,他到我们行去调研,他一句评价的话。他指的是银行业,现在这个灾难备份的现状叫有备无换,是有备份没切换,是这样的一个意思,他这个要求也是强制我们的切换,但是这样的一个切换确实有非常大的风险在里面。
第五个方面的压力还是对于信息技术的发展的压力,因为信息技术的发展是非常迅猛的,因为这里面会有很多硬件的升级、软件的升级。你比方说今年我们大量的主机升级、硬件升级那是被迫的没有办法,人家厂家说我不支持你了,你这样的一个大规模的升级,你像对于保障奥运会等等这个时间段你又不能做变更等等,这些工作实际上是有一个非常大的一个压力在里面。
下面呢我就谈四个方面,就是境内外存储一体化的体系的这个建设和管理。我们的建设的原则是建设和管理并重,防止这个重建设轻管理,实际上我们这个建设,甚至管理比建设还要重要,那么建设的原则就是要统一规划、分布事实,存储体系注重可扩展性、可用性以及安全性,管理策略就是要考虑很多方面了,容量、成本、需求等等。我们未来最终的发展模式,目前看得到的发展模式是两地三中心的这样一个发展模式。目前我们的所有的生产系统都是在张江园区来去运作的。在去年10月份的时候,我们已经建立成功,光纤距离在70公里左右,建立了一个备份中心,它的目的就是要防止一些很大的灾难,比方说地震,因为地震它的这个地震半径一般在三十多公里,所以基本上可以能够说,如果是在某一个地方出现地震,另一个方面还是有可能会幸存下来的,基于这样的一个考虑。然后我们在成都要建一个异地的千公里的一个备份中心,还有呢就是这个张江同时还要作为我们的重要的省支分行以及海外的分行的备份,比如说像奥运会这样重大的事件,因为现在已经是省集中了,如果出现这种省出问题,那还是有非常大一个风险。
在规划方面我们有两个层面的一个规划,一个规划是从范围上,一个是本地的、一个是同城的服务全球的服务全球的灾难备份体系。本地的我也不细谈了,同城的主要是在备份中心建立了以后,我们已经实现了存储复制的这样一个自动化的复制。那么在异地方面,我们目前正在做这个复制,那么异地的磁盘的复制我们还在规划中,没有确定,因为这个主要是涉及到投资的问题。
那对于海内外分行的前置系统的数据的异地备份,我们目前也是正在做。那么在级别上应该讲这个备份有三个级别,一个是数据级、一个是系统各级一个是应用级。数据级我们已经都完成了,系统级本地和同城也已经完全了,异地我们还没有考虑。在应用级本地也是已经完成了,目前重点要做的和我们觉得最有意义去做的就是同城的应用级的灾难恢复的体系。实际上达到目的就是我们起了一个名字,这是我们自己来起的名字,就是数据中心一体化建设,它的大致的意思就是生产中心和备份中心都要具有这个运行生产系统的能力,使得两个中心在出现灾难的时候,你从外界看看不出来有什么太大的区别。它的好处我想最主要的是要有效地利用备份中心的资源应对业务爆发性的增长,避免这个资源的闲置浪费。这一点的想法是基于我们去年资本市场爆增,我们的很多设备是在备份中心是没法启用的。那么应对这样的一个,而且这个备份中心比较传统的做法就是,我们把这个备份的资源用来做开发、用来做测试,但是实际上这个开发测试是用不了这么多设备、这么多资源的。那如何更有效地利用这样的一个资源?是我们接下来要做的,另外就是这么做也是减少切换的风险,有利于做好这个平滑的负载均衡。
那么实际上这件事情呢从技术的角度来看就是一个跨地区的、跨地域的服务器虚拟化和存储虚拟化,这张图就是表明我们的现状,现状我们就是海外分行的跟小型机的分区是独立的,很境内的分行是独立的。那么在主机层面,就是境内外分行都是采用同样的主机,里面只是说分区不一样来进行同城备份。那么刚才谈到了主要是一些技术架构。另外在管理方面首先要使得这个存储备份体系非常有效地运转,我们要进行大量的演练,去年我们从2006年以来,我们进行了多次演练。另外在这个存储架构方面,我们是采用了这个双层的SUN的架构,包括这个备份的SUN、生产的SUN还有这个OASUN,还有这个用来来跟灾备中心、跟备份中心相关联的这个,SCRDF,同步复制的这种SUN,所以我们可以讲,初步实现了这个存储池的虚拟化的管理。
在管理策略方面一个非常重要的手段就是容量管理,这也是我们ISO2000里面的一个重点,或者说今年2008年重点去做的一个工作,就是说要制定出,去年已经制订出了2007年的容量计划,今年正在制订2008年的容量计划,而且每个季度要出容量报告,包括每天的这种监控、容量预测模型。现在我们已经对于重点的系统,主要是网银核心,制定出了这个容量预测的模型。定期与业务部门沟通等等。
另外一个管理策略就是要进行成本分摊,因为业务部门对于这种数据的需求,它是无止境的,它什么数据都想要,但是呢你如果不把这种成本分摊给这个业务部门的话,它是没有这种禁忌的,它是没有顾忌地去要资源,所以这是我们举了一个例子,就是第四季度我们的这个对于各个业务系统,我们这个系统维护的人、天是多少,对于你这个系统占用的资源是多少,我都给你计算出来,然后把这个计算的结果,我要去给这个预算部门,我们的内部的预财部,由他把这些指标给各个业务部门,因为每个系统都有他的业务主管部门。
那么在存储策略方面主要是有在线、进线、离线三个存储的策略,进线主要是用来做这个数据交换还有内容管理方面的一些应用的,用进线存储。那么备份策略实际上绝对不是一个IT的或者技术能够做出来的,因为它是跟业务的需求有很大的相关的,所以我们去年花了一整年的时间跟业务部门去整理,你到底需要什么业务?因为你跟他去谈的时候他会告诉你,我所有的数据都要,但实际上如果是这样的话,他的这个投资或者是技术方案会非常复杂。所以就需要跟他们一点儿、一点儿地去把备份策略、跟业务、跟技术的结合点找到,我这里举一个例子,反正就是我们目前的一些备份的策略了。
那么对于全方位的存储的监控,我们目前主要是比如说主机的备份采用这个管理,在开放主要是NBU,并且我们是对于这个磁盘,比如说还有一些监控的软件在里面。那么我们已经制定出一个非常有效的性能数据库,就是每一天它能够把头一天的这个机器的性能通过图表的方式拿出来,随时可以看得到,这样的话对于我们下一步的决策、容量的决策会产生一个非常好的作用。
另外就是数据的安全,在磁盘里面是安全的,但是如果拿出来是非常不安全的,尤其是在应用系统不完善的情况下,很多业务数据他要传出来给业务部门,那么在这些方面,我们采用了从端到端的这种加密的技术,就是从数据中心出来的技术,除了当事人以外别人是看不到的,那么他直接传给这个,要这个业务数据的业务部门,在那边要装着一个终端,这样的话就保证只有两个当事人能够看得到这个数据。另外就是加强访问控制。现在所有的访问生产系统,首先从物理方面就是集中在一个地方,另外就是有一个电子密码生成系统,对于这个生成系统呢,必须要有事件或者是一个变更,我才能关联出一个,给他一个帐号或密码,然后他去做,做完这个以后,这个事情、这个密码在四个小时以后就会自动失效,这样了保证它的这个系统密码的访问控制比较严格。
那么对于未来的存储的发展思路,我想主要的目标就是要建立一个存储管理的统一化、自动化,融入到业务连续性的管理方面。那么在方向上我觉得我们还是要,进一步地、稳步地推进数据中心的虚拟化,这个方向我想是坚定不移的。但是呢步骤和具体的做法上,我想我们还是要采用一个谨慎的原则。因为毕竟现在这个各个技术,据我们的了解还不是特别成熟。比如说包括磁盘阵列的层次的虚拟化、服务器虚拟化、交换机虚拟化、专用设备虚拟化等等,我们会一直跟踪这样的一个新技术。
那么另外还是要继续推进这个成本分摊,最终呢主要是实现这个信息生命周期的这种自动化管理。
那好我就简要地先介绍一下交通银行数据中心的存储体系的这样一个构想,谢谢。
|
|
|
|
|
|
| 演讲阵容 |
代表性金融机构:
 |
| 特约合作伙伴 |
|
|
|
|
|
|
|
|
|
|
|
财经门户:
金融界(战略财经门户支持媒体)、搜讯网、中国金融网、中国金融界网、中国财经网
国脉金融服务网
存储专业门户:
存储在线、存储时代
IT媒体:
网易科技、新浪科技、中国信息产业网、IT168、51CTO、中国IT实验室、人民邮电报
|
|
|