活动概览

时间:2008年4月10日
地点:北京-金融街威斯汀大酒店

主办单位:金融时报社
承办单位: 埃普威
支持单位:相关商业银行、保险、证券、基金机构
总人数:300人

近期活动一览

>2007'金融行业网络信息安全高峰论坛
>首届中国金融业呼叫中心行业评选
>2007'通信行业网络信息安全高峰论坛

近期活动回顾

>2007'金融行业网络信息安全高峰论坛

 2008'中国金融行业存储峰会介绍 | 存储议题 | 峰会议程 | 合作联系 | 注册参会 | 组织单位介绍
证券公司容灾建设几点思考

 

 

海通证券股份有限公司信息技术管理部总经理助理王洪涛

  大家下午好,可能听了这么长时间可能大家也有一点儿累了。实际上上午到现在,可能很多地方很多的来宾都是介绍的是说,宏观上是怎么来做的。那可能对我们证券公司来讲,以前也很少在这种场合来介绍我们的技术系统,那么这次可能从细节上面可能会介绍得更多一些。
  那么可能大家都知道,从2006、2007年整个资本市场发展,让全国所有的人民都对这个证券行业特别关注,那么2007年整个一个爆发性的行情,实际上也发生了一些,行业内也发生了一些事故,比如说网络拥塞,出现这种服务器当机,如果在座的有做股票的话,那么实际上就是整个系统的要求,是可以说非常非常地高。那么可能是每一个,比方说你要下单的时候,这个系统一分钟下不下去,可能对你来讲已经,绝大部分的客户都是无法忍受的,那么实际上就是从证券行业,这个信息系统有要求来讲,我们不谈其他的,就是从容灾这一部分来说,我们有两种要求是特别特别地重要,那么第一个的话是在交易时间段,那么可用性的要求可以说是极高的,我想可能除了一些军工的一些方面,在这些方面证券行业在交易时间段,应该是要求最高的系统。那么再一个就是数据是证券公司的最重要的资产,它是不能有丢失的。那么基于这两个方面的要求,我们来看我们会遇到哪些挑战。那么实际上在可用性方面,那么我们主要是说比方说网络通讯故障导致的不可用,因为我们现在的整个这个证券都是集中交易的,那么营业网点和客户是散步在全国各地,实际上甚至还有很多的韩国、日本、香港的一些客户,他通过网上交易来做证券交易,那么实际上还有前一段时间还有,我还接到一个电话,就是说是阿拉伯国家的有一些人,也在那边通过网上交易来做国内的证券交易。
  那么从可行性要求,那么网络通信故障、硬件故障导致不可用,那么还有存储系统的故障导致不可用,那么还有其他的一些很多的软故障,我们刚才前面都讲到一些硬故障,那比方说操作系统、数据库的软件故障导致的不可用,还有处理容量不够。比方说我只能支持这个每天每秒钟处理一千笔,那么突然一下子变成每秒钟要求五千笔了,那么这个时候导致的不可用。那么还有一点就是人员操作的失误,再一个是软件升级引入的BUG,还有一个就是机房的故障,这是可用性方面我们面临的一些挑战。
  那么还有一些数据保护方面呢,从数据来讲,比如说存储设备的一个故障,那么可能会导致数据丢失,那么操作系统或者是数据库的故障,那么也会导致这个数据库丢失,那么操作系统你比如说我删除一个文件,不小心把一个数据文件删掉了,那么也会导致这个数据丢失,那么数据库类的操作失误,也会导致数据丢失。那么站点故障,再一个就是城市的灾难。
  因为我们现在的政权公司,绝大部分的来讲,应该还是说做灾备基本上还是,因为考虑到人员的调动的一个关系,还是在同成的比较多一点儿。那么从容灾技术来讲,我们前面碰到这些挑战基本上来说,有好几个层面来解决这个问题,那么从上到下那么可能是应用系统,那么比方说我这个数据写往两个地方去。那么再一个是中间件,那么比方说通过这个数据库。那么还有一个是操作系统同时把这个数据往两个方面写。再就是存储系统的一个镜像。
  那么实际上对于我们公司来讲,对于我们证券行业来讲,我们重要的并不是说是这个,肯定不是一种技术的使用,那么我们是为了达成我们前面的一些目标来规避那些风险,那么实际上我们这些技术可能是要组合来使用。那么我们公司经过了大概十几年的一些,进展,那么可能就是说提出来大概是这么一个参考的架构。应该基本上来说还是一个叫做两地三中心的一个概念,左边这一块是我们的生产机房,中间这一个是我们的灾备机房,还有一个黄色这一部分是叫做数据灾备机房,因为我们基本上来讲这个是应该是在第三地的,不在一个城市里面,主要是为了抵御这个城市的灾难,可能这个图一下子比较大,那么我们下面每个机房、每个机房分别来讲解。
  那么我们在生产机房里面,实际上是有三套设备,那么服务器的话比方说A和B,那么交换机、存储,那么它这还有一套服务器和存储C,那么对于生产来讲,核心服务器A和B,因为我们公司是使用的是采用HACMP的技术,那么有一些公司是用的其他的技术。那么我们同时把这个数据写往存储A和存储B,那么同时还在生产机房里面通过HADR同步或者是镜同步地传输到服务器C上去。那么这样的一个架构它是有一个什么特点呢?首先任何的单一的硬件故障都不需要人工干预就可以正常地运行,那么任何的单一的系统级的软件的错误,应该说都是可以快速地在生产机房恢复系统运行的。那么我举个例子来讲。
  比方说这个服务器A和B有一个坏掉了,马上就会有接管过去,那么即使是存储A和B坏掉了其中一个,也不需要有干预,因为这个还是需要有一份数据马上可以再用的。那么即使是这个里面整个都坏掉了,那么还有这个服务器C,当然了这个服务器C的话就是需要人工来干预的。因为我们考虑到这个生产机房还是需要重点保障的,因为我们灾备机房毕竟是人力配备还有周边的一些配置上面,和生产机房还是有一点点差距,虽然我们是基本按照一比一来配置。再一个在这里面,生产机房任何的一个运行状态,都有灾备的保护。那么可能它的保护的方式不太一样一点儿。如果说我是全状态下面,我是有两种灾备技术的保护,那么第一个是存储的一个远程镜像,那么第二个还有一个就是数据库或者是应用级的一个复制。
  还有一个是本地灾备,它除了防范硬件设备以外,就是说同时坏两个硬件设备以外,还有一个就是防止操作系统数据库的逻辑错误,以及操作系统人为的操作失误。数据库这些错误都是可以通过本地灾备来防范的。那么另外考虑到这些,因为我们用的机器基本上都是高档、高配的机器,那么在这里面的话我们也做了一个分区,那么在这个分区里面呢,它有一些其他的分区是在做其他的一些应用。那么也就是讲如果说我们除了容量不够了,那么我们可能会降低其他非核心应用的CPU的数量,而增加给它。因为我们这个证券行业里面和其他的行业有一个非常大的不同点,就是比方说可能银行来讲,我的这个服务器是希望要求到70%,那么对于我们来讲,我们是希望我们服务器的利用率永远不要超过30%,我们实际上30%就是我们的预警线,50%就是我们要准备系统升级了。而且所以说我们在这个容量方面也是要考虑到各个方面的问题。
  那么我们再看灾备机房,我们刚才谈到灾备机房里面是有两种方式过来的,一个是复制采集或者是容灾的方式。那么我们在灾备机房,实际上也是一台机器做两个分区,那么一个分区是准备接管存储镜像的这个灾备,另外一个分区是准备接管数据库复制或者是日志传送的这个灾备,那么它们起到的作用也是不一样的,我们前面提到就是说如果你在生产系统里面,做了一个删除的操作,然后呢这个时候我的生产机房又出了故障,那么这个时候实际上我就相当于完蛋了,我没有地方可以接起来,这个时候我的橙色的这个分区,就会接管起我真正的一个生产,那么还有一个就是数据灾备机房,那么它这个是一个,它的主要的目的是为了保证数据,它是一个交易性能比较低配的服务器。
  那么它的一个目的就是主要保障数据,无论在生产或者是灾备机房内的运行,它的数据都是在实时地对外传送,有一个保护,那么防范这个城市风险。那么另外我们为了防范在这个数据库里面的一些更改的操作,我们实际上在这边是做一个延时处理的。比方说你做了采集,我们也是延时处理,那么日志也是延时处理。比方说你删掉了一个表,那么我们可能会去看,因为我们这个表是延时半个小时的,一般来讲我们重要的一个操作,总归是在几分钟之内就会发现有问题。
  那么实际上对于整个灾备来说,还有很多地方要考虑,比方说我们的机房建设怎么做的,实际上我们现在所有的这个机房,包括生产机房、灾备机房,电力的话首先是要双路供电,而且都要配发电机,并且是UPS一般都还要很大量的一个冗余,因为空调也都是有冗余的。
  那么还有就是我刚才提到一个很重要的网络接入,我们现在全国大概有接近200个营业网点,那么每个网点到总部我们都是至少有两条地面的专线,同时还有天地的备份,有一个卫星的一个备份。那么我们的这个网上交易的接入和电话委托,我们网上交易是全国分布在十几个城市,那么容量上我们设计的话也是要求,至少可以容纳两个接入点的同时瘫痪。那么电话委托我们甚至可以,也是要求,同时拥有多个点的同时瘫痪。那么与各业务协作单位也是至少有两条接入,比方说到交易所,比方说到各个银行。那么生产机房与灾备机房之间,我们也是两条的裸光纤在连接形成环路。
  那么实际上刚才是讲的这个系统的架构的建设,那么实际上还有很重要的一点就是一个规范的运维,比方说每小时做巡检,每天做监控分析。因为我们证券行业还有一个特点,我们虽然是那个交易时间段非常重要,但是我们通常在周末是可以有停机的,那么我们是经常会利用这个周末来做切换演练、事件演练,因为可能大家如果是做股票的话经常会看到周六、周日如果你网上交易登上去,我们会有一个通知,就是说我们今天是在做测试,我们一般来讲我们会提前几天通知,今天会做测试,测试数据仅作为参考。
  那么还有一个从人员的角度来说,生产机房和灾备机房的人员是经常进行轮换,比方说每半年调换生产机房两个人到灾备机房,保证这个对整个系统的熟悉的程度。

  谢谢大家。

 

如何参会

方式一:
下载《参会回执表》,填好后传真至010—62072957参会

方式二:在线报名参会
注:欢迎金融机构人士免费参加,额满截止

演讲阵容
代表性金融机构:
特约合作伙伴
财经门户:
金融界(战略财经门户支持媒体)、搜讯网、中国金融网、中国金融界网、中国财经网
国脉金融服务网
存储专业门户:
存储在线、存储时代
IT媒体:
网易科技、新浪科技、中国信息产业网、IT168、51CTO、中国IT实验室、人民邮电报

 
 
2008'中国金融行业存储峰会组委会