一、RAID的基本概念
RAID:将多块磁盘以某种方式组织起来当一个存储设备使用。
RADI特性:
提高IO能力:通过磁盘并行读写实现;给RAID控制器添加自己的内存。
提高耐用性:通过磁盘冗余来实现。
二、RAID的级别
根据多块磁盘组织在一起的不同的工作方式,我们将RAID分为不同的级别:
RAID-0:RAID控制器将待存储的数据流切割为块,将分割好的数据块按顺序均匀分布存储在各个磁盘内。如果其中任何一块磁盘损坏,数据将丢失。
优点:提升了读、写性能;不会占用太多CPU资源;设计、使用和配置比较简单。
缺点:无冗余,不能用于对数据安全性要求高的环境。
可用空间:N*min(S1,S2,…)。
磁盘数:2个或更多,最少为2个。
适用领域:视频生成和编辑、图像编辑,其他需要大的出传输带宽的操作。
RAID-1:以镜像为冗余方式,对虚拟磁盘上的数据做多份拷贝,放在成员磁盘上。
优点:具有100%数据冗余,提供最高的数据安全保障;理论可以实现2倍的读取速率;设计和使用比较简答。
缺点:开销大,空间利用率低,在写性能方面提升不明显。
可用空间:1*min(S1,S2,...);
磁盘数:2, 2+(一般使用2块)。
适用领域:财务、金融等高可用、高安全的数据存储环境。
RAID-3:数据块被分为更小的块并行传输到各个成员磁盘上,同时计算XOR校验数据存放到专用的校验磁盘上。
优点:读写性能比较好;当有磁盘损坏时,对整体吞吐量影响较小;减少了开销。
缺点:控制器设计复杂;采用并行存取方式,主轴同步时吞吐量没有提高;效验磁盘的写性能有瓶颈。
磁盘数:3个或更多,最少为3个。
适用领域:视频生产和图像、视频编辑等;需要高吞吐量的应用环境。
RAID-5:采用独立存取的阵列方式,校验信息被均匀的分散到阵列的各个磁盘上。
优点:读性能比较高;中等的写性能;校验信息的分布式存取,避免出现写操作的瓶颈。
缺点:控制器设计复杂;磁盘重建的过程比较复杂。
可用空间:(N-1)*min(S1,S2,...)。
磁盘数:3个或更多,最少为3个。
适用领域:文件服务器、Email服务器、Web服务器等环境、数据库应用。
RAID-10:结合RAID-1和RAID-0,先镜像,再条带化。
优点:读性能很高;写性能比较好;数据安全性好,允许同时有N个磁盘失效。
缺点:空间利用率只有50%;开销大。
可用空间:N*min(S1,S2,...)/2。
磁盘数:2N个,(N≥2),最低为4个。
适用领域:多用于要求高可用性和高安全性的数据库应用。
RAID-50:RAID50是RAID5和RAID0的结合,先实现RAID5,再条带化。
优点:比RAID5有更好的读性能;比相同容量的RAID5重建时间更短;可以容许N个磁盘同时失效。
缺点:设计复杂,比较难实现;同一个RAID5组内的两个磁盘失效会导致整个阵列的失效。
磁盘数: 6个或更多,最低为6个。
适用领域:大型数据库服务器、应用服务器、文件服务器等应用。
常用RADI级别的比较:
三、RAID实现的方式和运行状态
软件RAID:功能都依赖于主机CPU完成,没有第三方的控制处理器和I/O芯片。
硬件RAID:有专门的RAID控制处理器和I/O处理芯片来处理RAID任务,不需占用主机CPU资源。