在中国计算机报主办的2013第六届中国数据中心大会上,惠普亚太和日本地区存储产品部首席技术专家Paul Haverfield详细剖析了大数据存储与软件定义的存储(SDS)。他强调说:“惠普的大数据存储把对象存储与文件存储和块数据存储集成在一个统一的平台之上,并且能够实现快速的数据搜索或查询,帮助客户获得所需的数据价值。作为惠普融合存储的一部分,HP StoreVirtual软件定义的存储产品已经在客户中得到了部署。未来,我们还会继续推出更多的软件定义的存储产品,为客户提供更多选择,既有整合的解决方案,也有单纯的软件。”
大数据改变存储访问方式
非结构化大数据时代已经来临。IDC的研究显示,目前,半结构化和非结构化数据已占全球数据总量的 80%,未来几年非结构化数据的年复合增长率将达到60%。主要来自于互联网、移动设备的非结构化大数据将改变存储的访问模式。
Paul Haverfield表示,大数据对于存储的影响主要体现在两个方面:第一,大数据将促进对象存储这种存储访问模式的发展和应用;第二,大量数据是静态的,如果不能对这些静态数据进行高效搜索,那么存储的价值也将荡然无存。HP StoreAll Express Query就可以实现快速的数据检索。惠普实验室的测试数据显示,以前检索5亿个文件至少需要42个小时,而使用HP StoreAll Express Query则只需要1.4秒。
以前,针对块数据这种结构化数据和文件这种非结构化数据,人们习惯分别用SAN和NAS设备来存储。在大数据时代,人们更倾向于通过将结构化和非结构化数据相关联,从中挖掘出更多具有商业价值的信息,为企业的经营决策提供支撑。在同一个存储平台之上,同时处理结构化、半结构化和非结构化数据是大势所趋,这也直接引发了SAN、NAS和对象存储这三种不同风格的存储的融合。“大数据平台必须支持对象存储和NAS,如果能够同时支持SAN就再好不过了。这就是惠普倡导的融合存储。”Paul Haverfield表示。
针对大数据需求,惠普对现有的产品线进行了整合、优化,比如惠普推出了业界首款专门针对大数据优化的x86服务器——HP ProLiant SL4500系列服务器。惠普是否也会推出大数据存储产品呢?其实,刚刚发布不久的HP StoreAll就是一个针对大数据的存储平台。
HP StoreAll是一个可以实现横向扩展的存储平台,它针对文件和对象存储可以提供高达16PB的存储容量,并且支持1000个节点,所有的高级存储功能都集成在单一集群中。
“Hadoop存储平台是为了挖掘和分析活跃数据设计的,数据的位置离服务器非常近,而HP StoreAll主要是为处理大量静态数据而研发的。HP StoreAll利用其动态归档功能,可以把静态数据存储在终端设备或者文档中,然后再进行数据挖掘。HP StoreAll动态归档库的计算能力比Hadoop更强。”Paul Haverfield介绍说。
HP StoreAll的一个特色就是将对象存储纳入其中。除惠普以外,还有一些存储厂商也宣称其统一存储平台可以同时支持NAS、SAN和对象存储。Paul Haverfield解释说:“有些存储厂商的对象存储产品仍然采用传统的双控制器方式,而HP StoreAll采用的是两个动态的控制器,可以实现高效的数据访问。从功能上看,其他厂商的对象存储产品通常没有内置数据查询、索引功能,如果要实现对数据的动态跟踪,就必须新增一个处理层。惠普大数据融合存储平台的一个优势就是可以统一对文件和对象的存储方式,实现容量与性能的横向扩展,并且可以在一个单一命名空间内对数据进行处理和索引。”
多样化的选择
随着“软件定义”这个概念日益受到追捧,越来越多的人相信,软件终将改变服务器、存储、网络甚至是整个数据中心的形态以及构建和应用模式。那么“软件定义的存储”是否会替代传统的硬件存储呢?IDC的数据显示,2016年,全球文件和对象存储的市场规模将达到340亿美元,其中超过三分之二的市场是由可横向扩展的软件定义存储平台创造的。
Paul Haverfield表示:“从惠普自身的情况看,在未来3~5年内,软件定义的存储将占存储总额的80%,剩下的20%则属于传统的高端存储。目前,软件定义的存储还不能承载那些对处理性能有极高要求的工作负载,比如在线交易等。不过,这部分需求只是金字塔塔尖的那一小部分。从这个角度分析,软件定义的存储还不能完全替代传统的硬件存储。在未来5~10年,我们仍将继续强化HP 3PAR存储产品线。HP 3PAR存储就是为那些对处理性能有极高的要求的工作负载准备的。”
未来,软件定义的存储会不会进一步挤压像HP 3PAR这样的硬件存储的市场份额呢?Paul Haverfield解释说:“未来,HP 3PAR存储的业务仍会不断增长。惠普的软件定义存储产品StoreVirtual VSA并不会挤压HP 3PAR的市场空间,两者面向的是不同的市场和客户群。从另一个角度看,HP 3PAR的硬件和软件平台都是基于工业标准x86服务器架构的,即使是一些专门的硬件也符合PCIe标准。我们已经对HP 3PAR未来的发展做了战略规划。HP 3PAR将在软件定义的存储方面发挥自己的作用。”
从目前情况看,以HP StoreVirtual VSA为代表的软件定义的存储产品,主要面向中小型企业客户或Web 2.0用户。Paul Haverfield举例说,某客户将闪存与可横向扩展的服务器相结合,并采用HP StoreVirtual VSA对原有的存储进行虚拟化。这样一来,该客户仍能继续使用那些已经使用了四五年的老旧存储设备,从而实现了投资保护。
Paul Haverfield认为,未来IT的重心将落在软件上,厂商将更多地发掘软件的价值,而硬件的商品化程度会高。从应用的角度看,用户可以借助软件对存储硬件及其功能进行重新塑造。HP StoreVirtual VSA就能够很好地与VMware或Hyper-V的应用环境进行融合。用户对VMware或Hyper-V的技术框架与管理方法十分熟悉。因此在很多情况下,用户自己管理存储会更加简便易行。
随着“软件定义”这个概念逐渐深入人心,越来越多的厂商开始进入这一市场,纷纷推出自己的软件定义的存储产品。“我们非常关注友商在软件定义的存储这个市场上的布局和进展。我们欢迎竞争,因为这样对客户是有好处的。”Paul Haverfield表示,“惠普拥有许多业内领先的技术和强大的服务器以及存储产品线。目前,我们的存储客户数已经超过17万。未来,惠普存储的业务模式是,由客户决定购买软件加硬件的解决方案,还是只采购软件。”