超融合存储供应商与产品类型之多,宣传之广使得IT部门难以辨别其技术是否适合企业自身。某些供应商会刻意掩盖产品性能上的缺陷,从而潜在地增加了存储成为系统瓶颈的风险,另有一些则过于注重性能而忽略了在服务器资源密集型环境中的应用,例如精简数据或信息保护。 在走向超融合基础架构之前,首先要解决性能、存储网络、数据精简、数据保护、安全性、可扩展性、硬件等等方面的问题。否则便会使得千里之堤溃于蚁穴。
通过超融合基础架构设备可以得到交钥匙式的一体化系统,其基于通用型设备,用现成的白牌服务器和软件定义的存储、计算和网络构成。硬件主要使用x86处理器架构的服务器,并配置硬盘或固态硬盘存储以及网络结构卡。超融合基……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
超融合存储供应商与产品类型之多,宣传之广使得IT部门难以辨别其技术是否适合企业自身。某些供应商会刻意掩盖产品性能上的缺陷,从而潜在地增加了存储成为系统瓶颈的风险,另有一些则过于注重性能而忽略了在服务器资源密集型环境中的应用,例如精简数据或信息保护。
在走向超融合基础架构之前,首先要解决性能、存储网络、数据精简、数据保护、安全性、可扩展性、硬件等等方面的问题。否则便会使得千里之堤溃于蚁穴。
通过超融合基础架构设备可以得到交钥匙式的一体化系统,其基于通用型设备,用现成的白牌服务器和软件定义的存储、计算和网络构成。硬件主要使用x86处理器架构的服务器,并配置硬盘或固态硬盘存储以及网络结构卡。超融合基础架构设备的网络通常是虚拟的机架式或叶节点交换机。虚拟化是所有HCI的核心,包括虚拟化管理程序及内置容器。
在本篇之中,我们将专注于超融合存储(即HCI中的软件定义存储),以及如何与其它基础架构配合使用。
超融合存储的来源
并没有标准化的技术规范告诉你什么才算是软件定义存储(SDS),所以任何存储软件或系统都可以自称SDS。为了区分存储系统上的SDS和超融合基础架构上运行的SDS ,供应商改称其为超融合存储。其可以运行在虚拟机管理程序内核之中,作为某台虚机或是容器,但更通常的情况下在单独的物理主机内运行,并且将服务器内置的SSD或HDD虚拟化,以创建虚拟存储池。
HCI服务器节点中的内置存储介质会呈现为便于共享的存储系统,交付虚拟机管理程序、虚拟机、容器和应用程序使用。对存储池的考量包含性能、容量、读写缓存、混合模式、二级存储和归档存储等方面,由于超融合存储软件部署方式的不同,选择不同供应商的体系架构会导致不同的结果。
后续章节中我们将深入探讨超融合存储技术中一些重要的部分。(部分使用超融合存储的存储系统本质上只是横向扩展存储,本文重点在于介绍超融合存储软件,而非硬件)
1. 超融合存储的效能
超融合存储效能包含四个重要的方面:容量、软件、数据保护和性能。许多人会将效能与存储容量等同起来,但实际上并非如此。
容量效能:超融合存储可以在最大程度上节省存储的损耗,这其中包含数据精简技术,例如内置的重复数据删除、压缩、零容量快照克隆以及自动精简配置。于是你可以用更少的存储容量来支撑整个基础架构。在该基础架构中还包括计算节点、网络端口、交换机、电缆、机架单元、收发设备、占地空间、制冷和管理要素。精简技术可以从中减少成本,降低运营性支出。
软件效率:这是超融合存储效能中最核心的问题。在超融合环境中,软件效率是由它所消耗的主机资源来衡量的。诸如处理器、计算内核、内存与I/O资源都是弥足珍贵的,主要用于应用程序工作负载。超融合存储软件在设计中很少以主机资源效率为首要因素,并且其中大部分会随着功能增加而更多地占用主机资源。
重复数据删除、压缩、分层、快照、自动精简配置、元数据管理、RAID等都是重要的存储管理功能,但这些技术都是以消耗大量处理器、内存和I/O为代价的。在理想情况下,摩尔定律带来的技术革新将持续保证这些功能。但不幸的是量子物理中的制约因素业已证明摩尔定律不会是技术发展的“铁律”,无法永远满足超融合存储对硬件资源无尽的索求。
伴随着从硬盘到快速固态磁盘的转变,超融合存储软件在这上面的问题日益凸显出来。软件中的某些设计如此低效,例如必须运行在自己单独的硬件上,因为其消耗过多的资源,难以让共享的应用程序负载有效运行。
数据保护的效率:这项指标旨在防范存储介质、计算节点和站点的故障、人为破坏、病毒入侵、以及恶意软件,同时最大限度地减少存储消耗。传统的超融合存储介质保护技术包括奇偶校验RAID 0, 1, 5, 6,50和60,但这并不足以隔离今天在超融合存储节点环境中的故障。大多数超融合存储现在已经抛弃了RAID技术而转向多镜像拷贝技术(亦称为三重镜像),即为每个并发节点或驱动器维护一个数据副本。例如,针对三个并发节点或驱动器的保护需要在不同节点和驱动器上存放原始数据的三个副本。
即使出现多处并发故障,多镜像拷贝仍可提供对数据的持续数据访问。但是这项技术效率低下,每个拷贝要消耗100%的存储容量,两个拷贝便意味着3倍的数据存储。这导致某些超融合存储供应商在主存储和二级存储上部署对象存储类型的纠删码。纠删码在传统的应用类型上只适合对象存储,因为处理读写操作过程中所引起的较高延迟。如果超融合存储软件编写时可以解决效率问题,那么确实可以提供与对象存储类似的纠删码,而不会明显增加额外延迟。这种方式可以实现高达11个9(即99.999999999%)的数据可用性,并且与多镜像拷贝相比,存储效率能够提高30%~60%。
超融合存储使用快照和克隆技术来防范人为错误、病毒和恶意软件。为了最大程度上避免存储容量的消耗,快照会写进行写入时重定向或采用自动精简配置。高效的超融合存储在数据保护方面不会限制快照和克隆数量。因为这种限制会直接影响恢复点目标(RPO)或中断时可能丢失的数据量。快照数量减少意味着恢复点目标间隔的时间越长。
站点级的超融合存储数据保护通常使用异步复制;比较少使用同步复制或写入异步复制;最少使用的是同步复制或同步镜像。这种环境中,效率体现在两个不同地理位置间所需的带宽。仅复制增量数据,或者使用重复数据删除和压缩技术可以减少带宽要求。最有效的超融合存储软件还会进行些许WAN优化,例如基于用户数据协议的数据传输协议。
性能效率:每块SSD或HDD可用的IOPS和吞吐量可以衡量性能效率。伴随着更快接口技术的出现,例如非易失性快速存储(NVMe)以及单位SSD磁盘容量的增加,我们可以拥有更高的IOPS。超融合存储软件能够发挥单块SSD更高的性能,从而减少了所需要的SSD数量,间接减少了对节点、存储机架、网络端口、交换机、电缆、收发设备、机架单元、占地面积、电耗功率和冷却等方面的需求。
通过加速存储介质的写入速度,高效的超融合存储软件或许可以不再需要为SSD配置RAM缓存,或为HDD配置闪存缓存。在实现相似性能的同时消除缓存的使用便无需在超融合存储节点之间(动态RAM缓存上)进行缓存一致性检验。其同时还DRAM整个生命周期内复杂而昂贵的支持所需,包括非易失性DIMMS、不间断电源、电池或超级电容。消除DRAM或闪存缓存可以节省资金和运营支出,且不会影响性能。
2. 超融合存储的可访问性
超融合存储的可访问性通常受限于超融合存储集群中的主机或节点、虚拟机、应用程序和容器的数量。这些资源处于闭环状态,无法由非超融合存储集群内的工作负载共享。开放超融合存储对这类的工作负载颇具价值,可以消除对共享存储系统孤岛的问题,从而节省时间、硬件、基础架构、管理、操作运营、故障排除以及成本。
存储协议支持是超融合存储可访问性的另一个重要方面。有些超融合基础架构仅支持iSCSI。另一些则基于文件协议,如NFS、SMB或者Hadoop分布式文件系统。还有能支持RESTful接口的对象存储。少部分产品支持所有(或绝大部分)的数据块、文件和对象存储协议,他们中的一些主要集中在光纤通道的NVMe(SCSI)、远程直接内存访问(RDMA)。存储协议对基础架构、带宽、网络、交换机、适配器或网络接口卡、电缆和收发器有重大影响。例如:RDMA 可能需要用到InfiniBand;光纤通道(FC);数据中心桥接交换以太网;或是第二版融合以太网上的RDMA。InfiniBand、FC和DCBx都需要独立的交换网络。
选择超融合存储时,请确保其支持企业的生态系统架构、存储协议以及当前或未来计划中的基础架构,并确保其在预算限制之内。
3. 超融合存储的性能
性能是最容易被炒作、误导和引发误解的参数。当超融合基础架构供应商指定IOPS或吞吐量时,这代表着什么呢?显然,其基于某款特定的硬件配置,但是性能参数是什么?提供IOPS数值的测试又是如何进行的?与生产环境中的超融合存储设备上运行的工作负载是否相似?如果不能达到的话是否有赔偿机制?同样的参数可以用吞吐量来衡量,利用业内标准的基准测试,例如存储性能委员会的SPC-1和SPC-2,以及基准性能评估公司的SPEC SFS,这些指标均与实际环境难以等同起来。标准测试结果中,许多都基于难以部署或不切实际的配置。要得到有效的性能比较,唯一的方法便是使用生产应用程序和数据进行测试,或是使用模拟器。
某些超融合存储软件聚焦在性能之上。这些对性能苛求的方案使用各种最新的存储技术,例如NVMe、RDMA和光纤通道NVMe。他们会巧妙利用到每个超融合存储节点中未被使用到的内核。甚至有使用并行I/O的方案,或是用节点上的DRAM来加速读写。最重要的是,超融合存储能够满足企业组织当前和未来的对应用程序工作负载的要求。并且在性能的各个方面作出权衡:可能会放弃资源密集型的应用程序,例如数据简化和保护,将其归入专属硬件,或是代价高昂的专业化硬件上。因为正如前文所述,这些应用会消耗过多的系统资源。
对超融合存储额外的思考
评估超融合存储软件时某些经常被忽视的因素有:所支持的硬件、分析、管理,以及成本。
硬件要求:所有软件的运行都离不开硬件,并且对硬件都有一定的要求。有些产品需要更多的处理内核。其它则对DRAM、NVMe闪存、高速适配器和交换机,电池以及其它易失性存储的使用支持有最低要求。所有软件都提供参考设计方案。
分析:现有的一部分产品当中已经包含于共享存储系统类似的存储预测分析工具。这类工具会跟踪并实时报告容量和性能的使用、检测潜在的热点数据以及故障排除辅助。预测分析功能根据趋势分析各种信息,提供问题报警,在麻烦出现之前提前预防。
软件管理:大多数传统的存储系统会使用过时的用户界面,而超融合存储接口却会使用常见直观的GUI,基于HTML5页面,甚至不需要有什么额外的培训。当然在管理中这也不一定总是受欢迎的,有些产品缺乏命令行界面。
成本:计算超融合软件成本或总体拥有成本首先要考虑软件许可证的费用,这可能是续订方式的许可证,或是永久许可证,但是在第三、四、五年后开始计算维护费用。下一步是运行支撑软件的硬件平台,考虑到硬件是通过虚拟机管理程序、虚拟机、容器技术与应用程序所共享,超融合存储需要消耗掉一部分的共享资源。超融合存储还可能配置有专用的硬件组件;支撑所用的基础架构,诸如适配器、网卡、交换机和电缆;加上使用期间硬件的维护和运营成本,诸如电力、制冷、人员配置和其它固定费用。
为超融合基础架构设备购买存储绝非是轻而易举的事情,需要细致耐心。逐条检查供应商的条款,提出质疑绝对是一项乏味而艰苦的事情,需要进行彻底的研究测试。遵循本文中提到的各项指南,使用超融合存储检查清单会是个不错的开始。
相关阅读:
作者
相关推荐
-
企业存储市场的夏天
即使云计算市场放缓,软件定义的存储和超融合基础设施瘫痪,企业存储中磁带的应用仍会巍然不倒。
-
是时候重新思考软件定义存储了
软件定义的存储市场似乎为用户带来了价值,但为什么还没有广泛采用呢?这其中一个原因是自建SDS的部署模式还没有被广泛接受。
-
存储经理人2017年9月刊:容器化你的存储
《存储经理人》2017年9月刊重点关注容器领域的企业级持久数据存储技术,未来我们将看到使用服务器闪存和新兴的持续性闪存的容器认知缓存,并且和持续存储层相结合。同时,NVMe over Fabrics对存储网络环境的革新有目共睹。另外,复制数据管理(CDM)专注于保护生产数据和改进生产数据副本的管理,正在走向主流。
-
软件定义存储市场迎新品 曙光与NetApp共推HyperStor
作为软件定义存储的两种重要形态,ServerSAN和HCI可在传统硬件平台上轻松实现计算和存储资源的灵活供给。中科曙光与NetApp共同发布曙光HyperStor软件定义存储产品家族。