2025-02-07 10:04:50
来 源
中存储
通用服务器
Supermicro Building Block 产品组合提供了扩展 Blackwell 解决方案所需的核心基础设施元素,并具有出色的部署时间。

Supermicro, Inc. 宣布其端到端 AI 数据中心构建模块解决方案的全面生产可用性,该解决方案由 NVIDIA Blackwell 平台加速。Supermicro Building Block 产品组合提供了扩展 Blackwell 解决方案所需的核心基础设施元素,并具有出色的部署时间。

Supermicro 采用 NVIDIA HGX B200 全面投产 NVIDIA Blackwell 机架级解决方案

该产品组合包括具有多个 CPU 选项的各种风冷和液冷系统。其中包括支持传统空气冷却、液-液 (L2L) 和液-气 (L2A) 冷却的卓越热设计。此外,完整的数据中心管理软件套件、机架级集成(包括完整的网络交换和布线)以及集群级 L12 解决方案验证可以作为交钥匙产品提供,包括全球交付、专业支持和服务。

Supermicro 总裁兼首席执行官 Charles Liang 表示:“在这个 AI 的变革时刻,扩展法则正在突破数据中心能力的极限,我们与 NVIDIA 密切合作开发的最新 NVIDIA Blackwell 支持解决方案可提供出色的计算能力。Supermicro 的 NVIDIA Blackwell GPU 产品采用即插即用的可扩展单元,具有先进的液体冷却和空气冷却功能,使客户能够部署支持日益复杂的 AI 工作负载的基础设施,同时保持卓越的效率。这加强了我们提供可持续、尖端解决方案以加速 AI 创新的承诺。

Supermicro 的 NVIDIA HGX B200 8-GPU 系统采用下一代液体冷却和空气冷却技术。新开发的冷板和新的 250kW 冷却液分配装置 (CDU) 在相同的 4U 外形尺寸中,冷却能力是上一代产品的两倍多。机架级设计提供 42U、48U 或 52U 配置,采用新的垂直冷却液分配歧管 (CDM),不再占用宝贵的机架单元。这支持 8 个系统,包括 42U 机架中的 64 个 NVIDIA Blackwell GPU,以及 52U 机架中多达 12 个系统,包括 96 个 NVIDIA Blackwell GPU。

全新风冷 10U NVIDIA HGX B200 系统采用重新设计的机箱,具有更大的散热空间,可容纳 8 个 1000W TDP Blackwell GPU。一个机架中最多可以安装并完全集成 4 个新的 10U 风冷系统,密度与上一代相同,同时提供高达 15 倍的推理和 3 倍的训练性能。

新的 SuperCluster 设计将 NVIDIA Quantum-2 InfiniBand 或 NVIDIA Spectrum-X 以太网网络整合到一个集中式机架中,从而在 5 个机架中实现无阻塞的 256 GPU 可扩展单元,或在 9 个机架中实现扩展的 768 GPU 可扩展单元。该架构专为 NVIDIA HGX B200 系统构建,原生支持 NVIDIA AI Enterprise 软件平台,用于开发和部署生产级端到端代理 AI 管道,结合 Supermicro 在部署全球最大液冷数据中心方面的专业知识,为当今最雄心勃勃的 AI 数据中心项目提供卓越的效率和上线时间。

液冷或风冷:Supermicro NVIDIA HGX B200 系统

全新液冷 4U NVIDIA HGX B200 8-GPU 系统采用新开发的冷板和先进的管道设计,进一步提高了用于 NVIDIA HGX H100/H200 8-GPU 系统的前代产品的效率和可维护性。新的机架级设计与新的垂直冷却剂分配歧管 (CDM) 相辅相成,冷却能力是上一代的两倍多,同时保持相同的 4U 外形尺寸,可实现更密集的架构和灵活的配置场景,适用于各种数据中心环境。

Supermicro 为液冷数据中心提供 42U、48U 或 52U 机架配置。42U 或 48U 配置在一个机架中提供 8 个系统和 64 个 GPU,在五个机架中提供 256 个 GPU 可扩展单元。52U 机架配置允许在机架中使用 96 个 GPU,并在 9 个机架中支持 768 个 GPU 可扩展单元,以实现最先进的 AI 数据中心部署。Supermicro 还为大型部署提供行内 CDU 选项,以及不需要设施用水的液-空冷却机架解决方案。

Supermicro 的 NVIDIA HGX B200 系统原生支持 NVIDIA AI Enterprise 软件,以加快 AI 的生产时间。NVIDIA NIM 微服务使组织能够访问最新的 AI 模型,以便在任何地方(无论是在数据中心、云还是工作站)的 NVIDIA 加速基础设施上快速、安全、可靠地进行部署。

对于传统数据中心,还提供新的 10U 风冷 NVIDIA B200 8-GPU 系统,该系统具有重新设计的模块化 GPU 托盘,可将 NVIDIA Blackwell GPU 安装在风冷环境中。风冷机架设计沿袭了上一代久经考验的行业领先架构,在 48U 机架中集成了 4 个系统和 32 个 GPU,同时提供 NVIDIA Blackwell 性能。所有 Supermicro NVIDIA HGX B200 系统都配备了 1:1 的 GPU 与 NIC 比率,支持 NVIDIA BlueField-3 SuperNIC 或 NVIDIA ConnectX-7 NIC,可在高性能计算结构中进行扩展。

Supermicro 为 NVIDIA 认证系统计划中包含的系统提供支持。该计划将 NVIDIA GPU、CPU 和高速、安全的网络技术整合到领先 NVIDIA 合作伙伴的系统中,确保配置经过验证,以实现最佳性能、可靠性和可扩展性。通过选择 NVIDIA 认证系统,企业可以放心地选择硬件解决方案来支持其加速计算工作负载。NVIDIA 已认证配备 NVIDIA H100 和 H200 GPU 的 Supermicro 系统。

适用于 NVIDIA GB200 NVL72 的端到端液冷解决方案

Supermicro 的 SuperCluster 解决方案基于 NVIDIA GB200 NVL72 系统,结合了 Supermicro 的端到端液体冷却技术,代表了 AI 计算基础设施的突破。该系统在单个机架中集成了 72 个 NVIDIA Blackwell GPU 和 36 个 NVIDIA Grace CPU,通过 NVIDIA 迄今为止最广泛的 NVLink 网络提供百万兆级计算能力,实现 130 TB/s 的 GPU 通信。

48U 解决方案的多功能性支持液-空和液-液冷却配置,以适应各种数据中心环境。此外,Supermicro 的 SuperCloud Composer 软件提供用于监控和优化液冷基础设施的管理工具,提供从概念验证到全面部署的完整解决方案。

面向 NVIDIA Blackwell 的端到端数据中心解决方案和部署服务

从概念验证 (PoC) 到全面部署,Supermicro 是具有全球制造规模的全面一站式解决方案提供商,提供所有必要的组件、数据中心级解决方案设计、液体冷却技术、网络解决方案、布线、管理软件、测试和验证以及现场安装服务。

其内部液体冷却生态系统提供了完整的定制设计热管理解决方案,包括针对 GPU、CPU 和内存模块的优化冷板,以及多功能冷却剂分配单元外形尺寸和容量、歧管、软管、连接器、冷却塔以及复杂的监控和管理软件。Supermicro 的生产设施遍布圣何塞、欧洲和亚洲,为液冷机架系统提供无与伦比的制造能力,确保及时交付,降低总拥有成本 (TCO) 和环境影响,并实现一致的质量。

声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。