关于超融合基础设施的选择标准

2016-12-07 10:43:27

来源
机房360

数据中心

企业客户对于超融合基础设施的构建仍然需要归结为两大关键要求：选择最适合的基础设施产品和服务的组合以匹配工作负载的需求;选择一款超融合模型，以便能够随着不断变化的存储需求适应和扩展，而不会打破可用预算。

超融合存储可以说是存储领域近来最新最火爆的术语。而根据企业客户所咨询的供应商的不同，超融合存储被赋予了不同的确切含义，其解决方案在对多款虚拟管理程序和工作负载类型的支持方面变化很大，并且其在硬件组件和拓扑的灵活性方面也各有不同。

无论供应商们对于这一术语的具体定义如何，事实是，企业客户对于超融合基础设施的构建仍然需要归结为两大关键要求：选择最适合的基础设施产品和服务的组合以匹配工作负载的需求;选择一款超融合模型，以便能够随着不断变化的存储需求适应和扩展，而不会打破可用预算。

虽然超融合基础设施的出现仍然被视为最近的现象，但实际上，其在企业计算方面的应用已经有相当长久的历史了。当代的超融合基础设施是指通过一款基于软件的存储控制器实现服务器和存储技术的统一——有时，其被称为软件定义的存储器或SDS——即：在服务器的软件堆栈实例化。该软件层用作存储控制器，以替代阵列存储控制器的功能。

这并不是一个新的理念。在最早的大型机架构模型中，磁盘存储设备具有最少的板载存储软件;大多数存储控制功能位于在中央处理器中运行的软件应用程序中，而不是在直接访问存储设备(DASD)的控制器上。

超融合基础设施的积极倡导者们正在回归到这一想法，并将其与从分布式超级计算架构(如服务器节点集群)中所提取的概念相结合，以创建旨在简化规模化扩展(通过添加更多的服务器存储节点)的超融合模型，提高可用性(通过在节点之间复制数据并实现故障转移)，并降低基础架构成本(通过使用更通用的存储组件替换硬盘来管理SAN和单片存储阵列，直接连接到服务器)。

然而，仅仅只是这样仍然是够的，其无法实现当代超融合基础设施的共同定义或共同架构。相反，必须使用一个矩阵来描述市场上出现的各种解决方案的特性。

如上面的矩阵所建议的，各种超融合基础设施解决方案(也被称为超融合存储，因为最初使用该技术用于在应用程序服务器后面的群集创建存储“节点”)的差异可以说是由两个参数所决定的：

1、解决方案包含的硬件模型

2、支持的解决方案能够提供对于不同虚拟化和物理工作负载数据的存储。

一些超融合存储节点是预制的或遵守严格的组件列表，在节点上施加固定的硬件模型。其他的对于可用于提供存储服务的硬件组件更灵活。

在矩阵的顶部是第二个参数：工作负载支持。一些超融合存储节点专用于特定的服务器管理程序，并且只能与使用该管理程序虚拟化和操作的工作负载一起使用。其他超融合存储节点可以与不同的虚拟管理程序结合部署，但为其套件的所有实例化提供公共的管理控制台。第三种解决方案模型为虚拟和非虚拟化工作负载提供存储，这对于需要操作多款虚拟管理程序，并与此同时还需要操作非虚拟化应用程序(例如高性能事务处理数据库)的企业而言尤其重要。根据领先的分析显示，混合虚拟化和非虚拟化工作负载混合的状况可能将会在一些企业中持续至少到十年之后。了解这一点对于规划者来说是极其重要的，因为其将对企业客户所选择的超融合解决方案的短期和长期的技术适合程度，以及投资回报产生直接影响。

上图中，我们将前文表格中的描述文字替换为产品名称，此图表提供了适合矩阵类别的产品的几个示例。VMware公司的EVO:Rail是使用预定义的节点硬件解决方案支持单一虚拟管理程序的超融合存储模型的示例。相比之下，Nutanix公司将其产品作为固定的硬件设备出售，但可以与多款虚拟管理程序结合使用。VMware公司的Virtual SAN可以被视为一款只支持一个虚拟管理程序工作负载的超融合模型，但其在部署在节点中的存储硬件类型方面提供了一些灵活性。而StarWind软件公司则是一家第三方软件定义存储供应商，以其具有单独实例化的解决方案支持多个虚拟机管理程序，同时支持跨所有实例的通用管理。DataCore软件还可以支持多个虚拟机管理程序以及非虚拟化工作负载，具有非常灵活的硬件标准和通用管理。

此矩阵是用于整理构建超融合基础设施选项的一个起点。根据其操作原理、工作负载支持和硬件依赖性对产品进行分类是找到最适合既定业务的解决方案的必要的第一步。

在选项被经过了排序分类之后，本文接下来将为广大读者诸君提供关于评估选项的关键标准。

选择合适的超融合基础设施技术的关键标准

有许多方法来定义超融合存储的选择标准。最好的选择最具商业经济头脑的：该数据需要能够提供最佳的成本控制、最佳的可用性、最佳的性能特性和适用性。

成本标准

成本控制已然成为当今大多数IT企业的一项工作内容。这在企业的分支机构或远程办公环境以及中小型企业中尤为重要，这些企业通常缺乏大型企业或云服务供应商所拥有的雄厚的IT预算资金。

成本是购置设备，并经营费用和劳动力的一个功能。高效的企业只采购存储数据所需的硬件，一些已安装的备用容量来满足峰值期间的容量需求。如果可以以一致和统一的方式管理存储设备，其结果将是减少基础设施的人员配置需求，并降低运营成本。

当考虑一款超融合存储基础设施时，成本标准应包括：

1、硬件的依赖性：某些超融合服务器/存储解决方案采用由特定虚拟管理程序供应商“认证”的预设计设备或硬件平台(来自特定供应商的硬件)的形式。两者都创建了与供应商试图替换传统或遗留单片存储器类似的一个硬件锁定。理想的情况下，企业客户应该寻找没有这种硬件依赖性的超融合解决方案。事实上，追求与硬件无关的方法是您可以根据需要或新技术的可用性在不同时间规模化扩展节点的不同部分的唯一方法。所以，第一个，也是最根本的问题便是“我企业需要什么硬件才能使解决方案奏效?

硬件的依赖性也应该联系规模化缩放一同考虑。说实话，硬件规格越紧凑严格，企业客户就越能够以模块化的方式缩放各种组件。考虑到“leap frog”这类典型的游戏总是在包括处理器、互连、网络和存储技术的计算机组件之间进行，这可能是一个巨大的问题。组件技术中的改进间隔可能非常不同，因此需要在任何给定时间更改一个组件或几个组件以跟上创新。套件的硬件依赖性越大，吸收技术变化的能力就越低。此外，随着时间的推移，被锁定在只能在一个列表范围内选择硬件可能会增加解决方案的成本。

2、多节点架构：领先的服务器虚拟管理程序供应商正在提出超融合存储模型，其启动需要至少三个(或更多)集群节点。一个节点通常需要一台物理服务器，一款存储软件许可证，集群软件(无论是部分的虚拟管理程序软件包，操作系统或专用第三方软件)，闪存设备和一个存储阵列或JBOD。最近的一个测试实验报告指出，一家领先的虚拟管理程序供应商的超融合软件(即“Virtual SAN”)的每个节点的成本范围在软件许可证8,000到11,000美元之间，服务器和存储硬件在8,000到14,000美元之间。这些数字需要乘以创建超融合基础设施所需的节点数——至少三个节点，但出于可用性和性能方面的原因，建议为4个节点。相比之下，一些第三方超融合服务器存储模型只需要两个物理节点即可启动，并且可以利用不太昂贵的硬件(例如，SATA，而无需SAS磁盘)。

3、可管理性：领先的服务器虚拟管理程序供应商(以及大多数超融合设备供应商)倾向于使用统一的软件堆栈来管理所有连接的资源和他们所提供的专门服务。当涉及到存储时，虚拟管理程序供应商们提供接口以用于相关功能的管理，包括了从数据镜像和跨存储节点的复制、存储资源的精简配置、重复数据删除和压缩、以及在阵列控制器上执行的其他功能。在本质上，它们将曾经被存储阵列供应商吹捧为区分的“增值”服务集中起来，集中到一款集中的基于软件的控制器，表面上是为了易于管理不断扩展的基础设施。这需要检查每项服务的操作，以确保其功能是与您企业所期望的能够与基础架构一起使用的。仅仅因为压缩服务在既定产品上令人印象深刻并不意味着其广域复制服务是最好的。

此外，请注意，尽管所有超融合供应商都认可存储软件服务需要在离线软件堆栈中部署实现，但是许多同时避免了将容量管理从存储阵列控制器抽象化的理念。这是许多超融合解决方案的一个值得引起注意的限制，因为这意味着容量管理是必须在每款存储设备上执行的单独的管理活动，通常需要专门的工具和技能。或者，如果存储容量被“虚拟化”或聚合到虚拟化资源池中，则其管理可以被集中并且在分布式基础设施上更简单地交付，如同其他存储服务的情况一样。

缺乏容量池，超级融合基础设施的整体价值可能会随着规模化扩展的发生而受到影响。在没有容量虚拟化的情况下，存储管理将变得僵化 ——特别是当需要从单个位置管理多个站点(例如分支机构或远程办公室)时，或者在大型企业中，当使用多台虚拟服务器管理程序时——每台均具有其自己的超融合模型。后一个问题——为多台虚拟机管理程序环境提供存储资源——可能现在似乎不太重要，但其可能会在未来几年内变得相当重要。根据领先的分析显示，大型IT企业将在2016年结束之前实现75%的工作负载虚拟化。然而，大多数企业将使用多款虚拟机管理程序，并且他们仍然有高达25%的工作负载运行在没有虚拟化和传统的存储设备。

如果存储被隔离在每种类型的虚拟管理程序之后，这种情况将对管理和管理费用产生影响，从而潜在地增加成本。当您企业评估一个特定的网站或集群的超融合解决方案时，这一问题可能不会太明显，但随着你对企业环境的管理和业务的增长，其肯定会走到前面和中心，发展成为一大问题。

故而企业客户应当选择那些能够交付虚拟管理程序、并且是与硬件管理无关的超融合基础架构技术，使之成为您企业减少管理基础架构所需的补充人员的关键。

4、硬件利用效率：当然，在考虑成本控制的同时，选择能够优化硬件使用的一款超融合基础设施模型也是十分重要的。例如，虽然市场上的大多数超融合产品可以利用动态RAM和闪存存储技术来创建缓存并提高应用程序的性能，但并不是所有这些产品都能够在实际上实现有效地使用，或者使得企业客户能够充分利用多样化以及当前市场上不断增长各种产品选择。DRAM比闪存更适合写缓存，但是你可能无法从某些超融合基础架构供应商的营销宣传稿中看到这些。通常，闪存被推荐用于其并不适合的目的，或者超融合产品供应商限制了客户使用更便宜的组件，或者选择最佳的技术以加速应用程序的性能，这有利于已经获得认证的供应商的产品。较之传统存储设备，这些都是超融合的倡导者们所喜欢的常见问题。

此外，某些超融合模型供应商要求将“传统”存储替换为更新的、经过认证的设备，这再次增加了超融合基础设施构建和运行的成本。大多数企业客户购买存储设备时，通常希望其能够实现五至七年的投资回报。对尚未实现其预期回报的传统存储进行强制报废淘汰和替换的要求可能会带来巨大的投资成本，需要谨慎考虑。

可用性标准

可用性应该是指导企业客户采购超融合技术的第二大标准。鉴于数据是任何企业组织的重要命脉，很明显，当前企业的数据需要确保24 x 7全天侯的可访问。因此，遵循以下指导应该是不言而喻的：

5、具有数据镜像的高可用性群集是超融合基础设施的标志，但是...企业客户所正在考虑的超融合软件的群集/数据镜像的功能必须是相当坚实的，必须包括内存缓存和缓冲区中的数据镜像以及存储在固态或磁盘上的数据。中理想的情况下，它们不应要求每个节点具有相同的设备，并且用于镜像HA群集的硬件节点的数目应当从两个开始，而不是三个，以成本节省。

6、HA镜像必须能够在不中断应用程序操作的情况下进行测试和验证。镜像始终作为数据保护机制存在，但镜像很少被测试，因为需要在测试期间停止应用程序，并在测试完成时重新同步工作负载和复制进程。您企业所选择的解决方案应该更简单，以便能够提供镜像过程的专门测试。您企业还应该考虑镜像故障转移是否最好是作为自动功能提供还是首先需要人工手动确认。考虑集群故障转移解决方案，如自动报警，即使最好的工具包有时可能会提供假警报。

7、可用性是双向的：在发生故障转移后，还必须提供故障恢复功能。通常这需要缓冲镜像写入，直到可以重新建立连接——这是一个相当重要但通常却是未经检查的要求。

8、本地HA不会抢占灾难恢复。用于本地故障转移的高可用性镜像应该通过一个metro或拉伸集群功能来补充，这将使得企业客户能够在两个地理位置不同的节点之间进行数据复制。真正可用的超融合解决方案应该具有广域同步和异步复制的拉伸集群的功能，最好是没有相同的节点配置要求。

匹配业务目标的标准

对于企业业务目标和性能的匹配是另外两大标准，这应该成为任何超融合服务器存储技术买家指南的一部分。这至少有两个关键部分：

9、运行多台虚拟机的服务器需要支持DRAM(也许是闪存)加速。使用基于内存的缓存和缓冲可以加快应用程序的性能，即使应用程序性能缓慢的根本原因与存储I/O并不相关。理想情况下，也将支持闪存技术，但不是强制性的。

10、整体上对于企业业务目标的匹配也很重要。匹配企业业务目标指的是技术适合于环境或其引入的环境。从超融合平台的物理足迹，其噪声管理或电源/ HVAC要求——当装配没有设备机柜或数据中心的ROBO办公室时，任何或所有这些都可能是重要因素，通过管理、操作和管理硬件/软件栈以及现场熟练工人的可用性、存储基础设施与不同虚拟管理程序或非虚拟化应用程序及其存储要求的兼容性与学习曲线相关联，一套超融合模型可能比另一套更适合于一套既定的工作负载和环境要求。在考虑替代产品之前，做一份关于设施，工作负载和用户限制的列表是值得的。

尽管上述这十项标准不可能详尽无遗面面俱到，但他们将大大有助于企业客户选择那些适合您企业业务长期良性发展的领域。在我看来，我更喜欢这样一款超融合基础设施解决方案：其应该是硬件和虚拟管理程序不相关的，将支持来自任何供应商的DRAM和闪存设备，以及具备直接连接和传统SAN连接的磁盘基础设施(这样我可以完全实现我企业预期的投资回报率)，能够优化虚拟化所有的存储容量，以便我可以从单一的软件接口在多个站点和异构存储设备管理容量分配和特殊存储服务。

小结：关于评估选项清单

总而言之，以下是企业客户可用于评估超融合存储选项的清单：

1)硬件依赖性

① 您企业需要什么硬件使解决方案奏效?

② 组件是否可以独立升级?

③ 您企业可以为这款解决方案从哪些供应商处采购节点/设备/组件?

2)多节点架构

① 高可用性的最小节点数是多少?

④ 当考虑HA和性能时，推荐的节点数是多少?

⑤ 节点(硬件+软件)的总成本是多少?

3)可管理性

① 您企业将使用哪些存储服务以匹配该解决方案?

⑥ 存储服务是最佳的还是中等的?

⑦ 存储服务是否包括容量管理?

⑧ 解决方案如何独立于计算，以进行存储容量的规划化扩展?

⑨ 解决方案是否与其他虚拟管理程序以及非虚拟化环境一起工作?

4)硬件利用率

① 解决方案是否需要闪存技术?如果是，如何使用?

⑩ 解决方案是否能够适当地使用DRAM和闪存?

11 在采用该解决方案之前是否需要您淘汰现有存储投资?

5)高可用性群集

① 节点群集功能是解决方案的一部分还是通过操作系统、虚拟管理程序或第三方集群软件提供?

12 如何配置和管理数据镜像?

13 集群中的所有节点是否需要具有相同的配置?

14 内存缓存和缓冲区是否在节点之间镜像?

6)镜像测试和验证

① 如何使用此解决方案测试镜像?

15 在故障转移之前是否可以在节点之间验证镜像?

16 节点故障转移是自动的过程还是需要手动干预?

7)故障恢复

① 如何使用此解决方案测试镜像?

17 在故障转移之前是否可以在节点之间验证镜像?

8) Metro集群

① 解决方案是否支持跨WAN或MAN的弹性或Metro集群?

18 解决方案中是否包括同步和异步镜像功能?

19 本地和远程节点是否需要具有相同的硬件?

9)DRAM支持

① 动态RAM是否支持缓冲写入?

20 如何保护DRAM缓冲器免受数据丢失?

10)匹配普遍的业务目标

① 超融合解决方案在功耗、冷却要求、噪声要求、物理可用空间方面是否适合其将部署的环境?

21 员工是否拥有足够的技能来部署、管理解决方案?

22 如果需要培训，是否可以从供应商获得相关培训?培训价格如何?

23 解决方案是否支持您企业拥有的工作负载/虚拟机管理程序?

在最后的分析中，确定超融合计算模型的最佳选择的要求将随着具体企业组织的不同而各异。一般来说，最好的选择是服务器虚拟管理程序和存储硬件“不相关的”。除此之外，规划人员还需要根据其预算，可用性和性能要求来选择其他选项，以确定最佳适配的超融合计算模型。

声明： 此文观点不代表本站立场；转载须要保留原文链接；版权疑问请联系我们。

关于超融合基础设施的选择标准

华为在玉溪启动云计算数据中心辐射南亚东南亚

数据中心虚拟化驱动全球数据中心架构市场

文丘里效应及其如何影响数据中心的效率

Google使用机器学习助力数据中心节能

设计模块化数据中心的三种设施类型分析

新型 Linux Rootkit PUMAKIT 使用先进的隐身技术躲避检测

OpenAI就ChatGPT宕机致歉：部分服务恢复，Sora仍处于瘫痪状态

N-able 收购现有战略合作伙伴 Adlumin

美方指控“与中国有关黑客”入侵多家电信公司网络，外交部驳斥

IDC：英方软件第九次获中国专业灾备软件厂商第一

阿里云盘回应相册陌生照片“乱入”问题：已快速修复，用户影响面较小

Backblaze：如何扩展公司的云存储？

以色列初创企业Datafy在种子轮融资600万美元

Cloudflare宣布R2的主要更新，包括事件通知和GCS支持

IDrive Backup新功能：云对云备份Google数据

60国签署巴黎AI峰会声明，美英缺席

富士通横滨国立大学使用 Fugaku 超级计算机推进台风龙卷风预报

Jülich 购买 D-Wave 量子计算机加强量子研究

Trane 将液体冷却集成到 AI 和 HPC 的热管理中

D-Wave 宣布举办 Qubits 2025 量子计算用户大会

Trendfocus 磁带和归档存储服务 CQ3 '24 季度更新报告

适用于 IBM Spectrum Scale 的联想分布式存储解决方案

CES 2025：威刚/XPG Schowcasing 工业和游戏存储设备

AI推理将驱动AIDC需求提升数据中心行业有望复苏

美光采样 6550 ION PCIe Gen5 高达 61TB 的 E3 数据中心 SSD

中国信通院发布《智能化医疗装备产业蓝皮书（2024年）》

使用 Ardis DDP10EF 和 SupremeRAID SR-1000 for M&E 解锁更高水平的媒体性能

多地点运营的企业，分布式管理与集中式管理哪种更具有网络保护的优势？

数字政府一体化建设白皮书（2024年）

Orico公司联合西部数据推出面向创作者的混合存储产品

科技要闻

IDC 发布《FutureScape 2025 年全球制造业预测 – 亚太地区（不包括日本）影响》报告

60国签署巴黎AI峰会声明，美英缺席

一月手机激活量统计数据出炉：华为领跑，小米崛起，苹果失速！

Nasuni 2024年财报创纪录

慧荣Silicon Motion公布24 财年第四季度财务业绩

关于超融合基础设施的选择标准

猜你喜欢

科技要闻