我们一般会根据标准上不同的安全级别标准选择不同的灾难恢复技术,总共有7 层:
1:0 层无异地备份
数据在本地备份恢复,无异地保存,没有灾难恢复计划。就是大家熟练使用的各种全备,部分备份,增量备份等,这些备份都保存在本地。在生产中心被毁的时候,无法恢复数据。
这是最惨的一种,恢复时间不可预测。这个是一般的小型企业,数据没那么关键的时候,可以选择。
2:1 层有数据备份,无备用系统。
将数据备份到磁带,然后护送到其他安全地方。这种层次,如果备份频率高,丢失的数据的少。如果备份的间隔较长,则数据丢失的时间较长。而且无专用备用中心,需要我们在目标机房重建相关系统,再将数据导入。这种是电信行业在1999 年,2000 年左右采用较多的灾备方式。但是,我在一些区域银行的数据中心迁移的时候,也见过这种方式,在目标机房重建系统,然后通过存储层磁盘镜像将核心数据恢复。但是这种级别恢复时间可以预测。
3:2 层有数据备份,有备用系统
数据备份到磁带,运送到专门灾备中心。灾备中心有备用系统,可预测恢复时间。灾备中心有硬件和网络设备来安装系统。但是这种方式还需要我们将磁带运送到灾备中心。恢复时间比1 层要短得多。
4:3 层电子链接(Electric Vaulting)
在2 层之上的优化是,将磁带上更改的数据通过电子链接记录,并通过数据链路传送到灾备中心,灾难发生后,只有少量数据需要重新恢复,恢复时间比以前都要短。前提是灾备中心要保持运转,生产中心和灾备中心的数据链路要保持畅通。比如某银行系统,下班之后将日志传送到灾备中心,灾备中心的数据进行replay,保持和生产中心同步。
我们熟知的很多解决方案都在3 层。在存储层,有IBM-ESS-PPRC,IBM-DS4000-RM,EMC-SRDF,还有HP,netapp 的解决方案。操作系统层面有IBM 的GEORM, veritas 的storage replication/volume replicator 等,在数据库层面大家都很了解了,DB2 的HADR,informix 的HDR(HADR 前身),oracle 的DG 等。在应用层有Q 复制等。
5:4 层快照拷贝数据
此层已经开始使用磁盘的方案。通过加快备份,最近时间点的快照恢复,一天内可以恢复。4 层灾备恢复有两个中心同时active,并管理彼此备份数据。备份是双向的。备份数据接收方和生产中心在地理位置上分离。工作负载可以共同分担,互为备份。在线关键数据拷贝不停传送,应用的恢复可以在几小时内完成。IBM 的HAGEO 和veritias-global cluster mannger 可以支持。
6:5 层交易完整性
生产中心和灾备中心数据要一致。只允许少量数据丢失。除了4 层技术,还要保证更新数据都要写入生辰中心数据库和灾备中心数据库,才算完成交易。生产中心和灾备中心用高速链路连接,关键的数据和应用一般在两个site 运行,以防运行中生产中心down,这样只有正在进行的交易丢失。恢复时间相当的短,在5 层较多的使用大家耳熟能详的数据复制功能,比如DB2 的HADR,和oracle 的replication。
目前国内的大银行一般都能达到5 级灾备标准。
7:6 层少量或无数据丢失
生产和灾备中心的数据拥有最高的同步级别。这个适用于不允许数据丢失并能快速恢复的业务。依赖大量硬件技术和OS 软件实现。从应用级别到硬件级别都要采取灾备措施。应用程序采用事务transaction 的方法开发,数据库采用DB2 的HADR,informix 的HDR,oracle 的DG。操作系统采用集群软件,如HACMP,veritas 的global cluster manager。
硬件层采取同步数据复制,IBM 的PPRC,RM,EMC 的SRDF,或者其他异步数据复制技术。
8:7 层方案和业务结合,自主管理
在6 层的基础上,增加应用自动恢复能力,在数据一致的基础上,使得系统和应用恢复时间更短。在这一层,数据0 丢失,是最高级别的灾难恢复。需要双重在线存储和冗余的网络接口。本级别对成本要求非常的高。
随着2 城3 中心的建设,我国的四大行和主要商业银行在容灾恢复上一般都能达到5 级的标准,少部分关键数据库可以达到6 级标准。区域银行根据自己的能力一般在4 级灾备上,也有达到5 级得。国内的国有银行,商业银行,大部分的区域银行大部分都进行了容灾恢复演练。国家要求每年至少一次,香港要求每周六都要容灾演练一次。
最后,各行业的容灾建设要遵守国家和行业监管部门下发的相关指导文件
2005年4月,国务院信息化工作办公室正式向信息产业部、广电总局、中国人民人银行、铁道部、税务部、民航总局、海关总署、证监会、保监会、国家电网公司下发了《重要信息系统灾难恢复指南》。
2007年7月,国务院信息化工作办公室领导编制的《重要信息系统灾难恢复指南》正式升级成为国家标准《信息系统灾难恢复规范》(GB/T 20988-2007 )。
《银行业信息系统灾难恢复管理规范》, 《银行业重要信息系统突发事件应急管理规范(试行)》 等,更多可到中国存储论坛中搜索。
声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。