一、什么是容灾?

容灾指的是,在异地搭建一套或多套和主生产系统一样的IT系统,用于应对在系统因发生意外(自然灾害、人为灾害、设备系统故障等)造成业务影响的情况,达到尽量让生产业务损失最小的目的。

二、容灾分类

容灾的分类分为数据级容灾、应用级容灾业务级容灾,接下来我们就详细了解下这几个分类的定义。

数据级容灾:该方式是通过异地建立容灾系统,该系统主要做数据的远程备份,在灾难发生之后确保原有的数据不会丢失或者遭到破坏。该方式是保证数据保护能达到容灾级别,应用在发生意外时会中断的。实际上可以理解为异地备份存储数据。

容灾技术方案详解,有没你不知道的?_组网

应用级容灾:在数据级容灾的基础之上,在备份数据中心的基础上再部署一套和主数据中心相同的应用系统,通过同步或异步复制技术,这样可以保证关键应用在允许的时间范围内恢复运行,尽可能保障服务是完整的、可靠的和安全性,从而尽可能减少灾难带来的损失。应用级容灾生产中心和异地灾备中心之间的数据传输是采用异类的广域网传输方式;同时应用级容灾系统需要通过许多的软件来实现,可以使多种应用在灾难发生时可以进行快速切换,确保业务的连续性。

容灾技术方案详解,有没你不知道的?_级联_02

业务级容灾:全业务的灾备,除了必要的IT相关技术,还要求具备全部的基础设施。其大部分内容是非IT系统(如电话、办公地点等),当大灾难发生后,原有的办公场所都会受到破坏,除了数据和应用的恢复,更需要一个备份的工作场所能够正常的开展业务。

三、容灾系统能力的重要指标

RTO:代表系统在遭受灾难后,恢复系统的时间

RPO:代表系统在遭受灾难后,允许丢失的数据量

两个指标都是越小越好,最厉害的情况下就是两者都等于0,目前业界的容灾系统能做到的是无限接近0。当然这两个指标越小,容灾系统投入的成本也就越高。可容忍的灾难损失和容灾系统的投入成本间的衡量,是一门非常高的学问。

容灾技术方案详解,有没你不知道的?_组网_03

四、容灾解决方案全景图

容灾技术方案详解,有没你不知道的?_组网_04

五、两地三中心

本地生产中心:对外提供服务。

同城灾备中心:通常在离生产中心几十公里的距离建立同城灾备中心,应用可在不丢失数据的情况下切换到同城灾备中心运行,是两地三中心容灾方案的第一级容灾保护。

异地灾备中心:通常在离生产中心几百或者上千公里的地方建立异地灾备中心,应对区域性重大灾难,实现周期性异步复制灾备,是两地三中心容灾方案的第二级容灾保护。

两地三中心常见组网架构图

级联组网(同步+异步)

容灾技术方案详解,有没你不知道的?_组网_05

级联组网(异步+异步)

容灾技术方案详解,有没你不知道的?_组网_06

并联组网(同步+异步)

容灾技术方案详解,有没你不知道的?_组网_07

并联组网(异步+异步)

容灾技术方案详解,有没你不知道的?_数据_08

两种组网区别

组网类型

优势

不足

级联组网

对生产中心性能影响小。

当发生区域性灾难时,如果同城灾备中心完全受损,系统RPO将较大(具体值需参考异步复制周期的大小)。

并联组网

当发生区域性灾难时,能有效避免级联组网的不足。

对生产中心的性能要求较高。 

六、常见容灾组网图

主备容灾

容灾技术方案详解,有没你不知道的?_数据_09

容灾技术方案详解,有没你不知道的?_数据_10

注:因是主备容灾方案,所以只需存储层打通,数据及时同步即可

双活容灾

容灾技术方案详解,有没你不知道的?_数据_11

六层双活:存储层、主机层、应用层、网络层、安全层、传输层。