文章目录
- 背景
- 一、RTO是什么?
- 二、RPO是什么?
- 三、容灾设计
- 四、举个例子
- 五、参考文档
背景
当灾难发生时,基础设施或业务服务等处于不可用状态,我们需要关注的两个关键技术指标,也是很多企业或用户的核心KPI,RTO和RPO。
一、RTO是什么?
一个是RTO,恢复时间目标(Recovery Time Objective),即灾难发生后,软件信息系统从停顿到必须恢复的时间要求,也就是企业或者用户可以接受多久没有改软件信息系统,可能是1天,也可以是1s,具体需要根据用户要求进行相应的容灾设计。假设设置为20s,那么20s内必须恢复到正常状态。
二、RPO是什么?
另一个是RPO,RPO 恢复点目标(Recovery Point Objective),即灾难发生后,数据必须恢复到的时间点要求,也就是企业或者用户可以接受多少业务数据的丢失,可能是上周的备份数据,也可以是灾难发生前1s交易的实时数据,具体需要根据用户要求进行相应的容灾设计。假设RPO设置时间为10s,那么发生灾难的时候,数据最多丢失10s的数据。
三、容灾设计
容灾(灾难恢复)设计
为了将信息系统从灾难造成的不可运行状态或不可接受状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受的状态而设计的活动和流程,常见的有:同城主备(冷备)、同城双活、两地三中心、三地五中心等等。
四、举个例子
拿金融行业的云平台举例如下:
考虑应用于金融领域云计算平台的重要性和发生故障或瘫痪的影响程度,应用于金融领域云计算平台至少应达到容灾能力 3 级要求,对应的 RTO、RPO、可用性等关键指标要求如表 2 所示。
五、参考文档
JR/T 0168—2020《云计算技术金融应用规范 容灾》
https:///bzgk/gk/view/yulan.jsp?i_id=1877&s_file_id=1795 RPO和RTO的区别
https://www.jianshu.com/p/6a3027538f9d RPO和RTO