自己装过SSD硬盘的都知道,想要SSD发挥全部实力,需要在BIOS里面把SATA模式设置成AHCI模式。这样对于SSD来说能够获得更好的性能。目前最新的存储接口M.2和SATA-E接口都是采用的PCIe通道,而对于PCIe接口想要发挥最高性能,就需要NVMe了。
不只适用于盘 企业级存储是NVMe更大的舞台
简单说,NVMe其实与AHCI一样,都是逻辑设备接口标准。NVMe全称Non-Volatile Memory Express,非易失性存储器标准,是使用PCIe通道的SSD一种规范。NVMe接口标准拥有诸多优势,首先NVMe标准是面向PCIe SSD的,使用原生PCIe通道与CPU直连可以免去SATA与SAS接口的外置控制器与CPU通信所带来的延时,高性能是NVMe相对SAS等协议的首要优势。
其次,早期的PCIe SSD都面临着驱动兼容性问题,每个产品都有对应不同系统的专用驱动,原生PCIe SSD需要加载驱动才能够正常引导。NVMe标准的出现解决了这个问题,NVMe SSD无需厂家提供相应的驱动就可以正常工作,目前Windows、Linux、Solaris、Unix、VMware、UEFI等都加入了对NVMe SSD的支持。
高性能和标准化带来的易用性在PCIe SSD大规模部署和高负载场景下就会显露出来,比如做缓存,做本地存储,做分布式存储、ServerSAN等。但需要指出的是,今天的NVMe已经趋于成熟,其并非仅仅适用于一个SSD盘,一个系统也可以是NVMe,包括全闪存阵列、全闪存的一体机高性能SAN和NAS系统等。这就拓宽了NVMe的应用,准备“蚕食”企业级存储系统了。
基于NVMe的企业级存储系统面临的挑战和解决之道
Memblaze副总裁张泰乐博士在2017存储峰会上介绍到,与传统的SAS存储架构相比,基于NVMe企业级存储架构直接通过PCIe Switch将NVMe SSD与CPU相连,这个路径短,由于NVMe本身对多核CPU支持非常好,能够充分利用CPU资源,所以基于NVMe 的存储系统性能可以做的非常高。
当前已经有包括Pure Storage在内的诸多厂商都在做全闪存阵列,由于分布式软件系统的快速进化和迭代,很长时间里基于x86标准服务器的分布式全闪存系统非常多,这类产品通过多副本等软件层面的数据保护技术保障数据安全和业务连续,系统硬件层面的高可用性考量则是欠缺的。
而全闪存阵列则以SAS SSD居多,原生NVMe SSD的全闪存阵列尚在爆发前夕。要设计一款NVMe SSD全闪存阵列,需要盘到系统控制器、主板、数据保护算法乃至系统上每个软硬件环节的彻底革新。
全闪存阵列首先要做的是系统级的高可靠和高可用性,这点基于SAS的存储系统则对全闪存阵列有着诸多的借鉴意义。(下图是一个基于NVMe SSD的存储架构)
从上图不难看出,要把NVMe推向企业级存储系统,首先要做双端口盘,实现盘级高可用性。双端口盘两个服务器连到一个盘上,单个链路出现掉电、短路等故障并不会影响盘向应用提供服务。双端口需要Memblaze与存储阵列以及PCIe交换机等厂商共同努力才能转化为系统高可用性的有效保障力量。双端口是SAS盘的主要特性,这也是早期PCIe SSD能够轻松替代系统中SATA SSD,但却无法取代SAS SSD的主要原因之一。
除此之外,高密度的JBOF设计是NVMe时代另一个关键问题。张泰乐谈到,相比JBOD,基于NVMe SSD的高密度JBOF面临着一些新的挑战。首先是供电。一个NVMe SSD功耗在25w左右,约为SAS SSD的两倍,这意味着一个60盘位的JBOF需要提供至少1500w的功率给硬盘,而一个主流的60盘位高密度JBOD的电源功率只有1700w,所以JBOF首先要在电源、硬盘背板的供电设计上做以改进。其次,功率大了之后,机箱的风扇、风道等散热系统需要更加高效,如果机箱内温度过高,容易影响SSD的寿命和稳定性。
复杂的布线。每个U.2接口的盘普遍采用PCIe3.0 x4接口,每个Lane需要4根线用于数据传输。此外还需要两个时钟线。这意味着一个60盘位的JBOF需要布超200根线。这对于背板和主板设计要求都非常高。
对于高密度JBOF的设计,Memblaze从U.2盘的设计上提出两个方案。第一个是做低功耗的NVMe SSD。当NVMe SSD功耗降到接近SAS SSD的水平,那么机箱的电源、背板,甚至风扇的设计难度都将有质的降低,甚至原有的JBOD机箱技术可以直接拿来。据悉2018年Memblaze将会在低功率NVMe SSD上实现突破,届时JBOF的将有更为易用的NVMe SSD。
目前,Memblaze新一代PBlaze5 PCIe NVMe SSD已经全面支持双端口功能,多主机通过PCIe Swich实现对设备的共同访问,避免单主机宕机导致上层业务中断的风险,提高系统可用性。其次,通过改进SSD设计,消除时钟也是一个重点的降低主板布线难度的研发方向。
Memblaze的客户及合作伙伴
据了解,PBlaze5已经是Memblaze第二代NVMe 标准的PCIe SSD,集合了Memblaze最新MemSpeed 3.0 和 MemSolid3.0技术,在延迟、IOPS、性能稳定性等关键指标上都到达了新的高度。此外,PBlaze5 900还拥有签名固件、数据安全加密保护等技术全面保障设备高可靠性、高可用性及数据安全。
Memblaze正在与存储系统与板卡合作伙伴合作研发新一代的全闪存阵列系统。随着双端口、低功耗盘的实现,NVMe SSD将更加适用于全闪存阵列。另一方面NVMe-oF也在高速进化,当从盘到系统乃至网络都协同走在演进的快速路上,基于NVMe SSD的全闪存阵列实现是必然。