在灾难恢复方面,目前业界公认有三个目标值得努力。一是恢复时间,企业能忍受多长时间没有 IT,处于停业状态;二是网络多长时间能够恢复;三是业务层面的恢复。整个恢复过程中,最关键的衡量指标有两个:一个是 RTO,另一个是 RPO。所谓 RTO,Recovery Time Objective,它是指灾难发生后,从 IT 系统当机导致业务停顿之时开始,到 IT 系统恢复至可以支持各部门运作、恢复运营之时,此两点之间的时间段称为 RTO。所谓 RPO,Recovery Point Objective,是指从系统和应用数据而言,要实现能够恢复至可以支持各部门业务运作,系统及生产数据应恢复到怎样的更新程度。
容灾设计指标主要与容灾系统的数据恢复能力有关,最常见的设计指标有RTO 和RPO。
RPO是指能把数据恢复到过去的那一个时间点,RTO 是指在出现问题后“什么时候”可以恢复数据。
RPO可简单地描述为企业能容忍的最大数据丢失量。为了更好地理解,可以想一下传统数据备份方式,一般备份都是一天做一次,通常是在晚上。如果第二天出现错误,那从备份完成后到错误出现时所写入的数据都无法挽回了,这期间没有备份,数据就丢失了!这种情况下,RPO就是24小时。
为了改进RPO,数据保护必须更频繁地进行。大多数情况下,增加备份的频率是不现实的。
原因有:1.应用的高峰时段无法进行备份操作;2.备份数据所花时间太长。为了改进RPO,需要有新的方法,这种方法就是恢复管理,用连续复制和快照技术能有效地改进RPO。
RTO可简单地描述为企业能容忍的恢复时间。在传统的数据保护中,备份数据是不能立即使用的,必须先恢复。对象级别的恢复功能可以有效恢复单个的目标,如一个文件或一封邮件,甚至是许多文件和邮件的集合。然而,恢复整个数据库和海量数据时仍需要时间。
要解决这个问题,不得不对生产数据进行复制,创建镜像快照或连续复制,或两者都做。因为复制是在线的,能立即投入使用,整个数据库或海量数据的RTO也许只有5分钟或更短。
然而在设计一个容灾系统时,不能过分追求RPO和RTO,因为RPO和RTO越小,投资将越大。而总体投入成本越高,投资回报率将越低。从经济角度考虑,最佳的容灾解决方案不一定是效益最好的容灾解决方案,因为容灾系统的总体投入TCO和投资回报ROI,对于许多用户来说是十分重要的设计指标。 数据保护一般有3个技术手段实现:持续可用、快速恢复、可以恢复。这3种方式的投资和造成数据丢失是不同的,请看图1。
TechTarget中国原创内容,
© TechTarget中国:http://www.techtarget.com.cn