Supermicro Building Block 产品组合提供了扩展 Blackwell 解决方案所需的核心基础设施元素,并具有出色的部署时间。
Supermicro, Inc. 宣布其端到端 AI 数据中心构建模块解决方案的全面生产可用性,该解决方案由 NVIDIA Blackwell 平台加速。Supermicro Building Block 产品组合提供了扩展 Blackwell 解决方案所需的核心基础设施元素,并具有出色的部署时间。
该产品组合包括具有多个 CPU 选项的各种风冷和液冷系统。其中包括支持传统空气冷却、液-液 (L2L) 和液-气 (L2A) 冷却的卓越热设计。此外,完整的数据中心管理软件套件、机架级集成(包括完整的网络交换和布线)以及集群级 L12 解决方案验证可以作为交钥匙产品提供,包括全球交付、专业支持和服务。
Supermicro 总裁兼首席执行官 Charles Liang 表示:“在这个 AI 的变革时刻,扩展法则正在突破数据中心能力的极限,我们与 NVIDIA 密切合作开发的最新 NVIDIA Blackwell 支持解决方案可提供出色的计算能力。Supermicro 的 NVIDIA Blackwell GPU 产品采用即插即用的可扩展单元,具有先进的液体冷却和空气冷却功能,使客户能够部署支持日益复杂的 AI 工作负载的基础设施,同时保持卓越的效率。这加强了我们提供可持续、尖端解决方案以加速 AI 创新的承诺。
Supermicro 的 NVIDIA HGX B200 8-GPU 系统采用下一代液体冷却和空气冷却技术。新开发的冷板和新的 250kW 冷却液分配装置 (CDU) 在相同的 4U 外形尺寸中,冷却能力是上一代产品的两倍多。机架级设计提供 42U、48U 或 52U 配置,采用新的垂直冷却液分配歧管 (CDM),不再占用宝贵的机架单元。这支持 8 个系统,包括 42U 机架中的 64 个 NVIDIA Blackwell GPU,以及 52U 机架中多达 12 个系统,包括 96 个 NVIDIA Blackwell GPU。
全新风冷 10U NVIDIA HGX B200 系统采用重新设计的机箱,具有更大的散热空间,可容纳 8 个 1000W TDP Blackwell GPU。一个机架中最多可以安装并完全集成 4 个新的 10U 风冷系统,密度与上一代相同,同时提供高达 15 倍的推理和 3 倍的训练性能。
新的 SuperCluster 设计将 NVIDIA Quantum-2 InfiniBand 或 NVIDIA Spectrum-X 以太网网络整合到一个集中式机架中,从而在 5 个机架中实现无阻塞的 256 GPU 可扩展单元,或在 9 个机架中实现扩展的 768 GPU 可扩展单元。该架构专为 NVIDIA HGX B200 系统构建,原生支持 NVIDIA AI Enterprise 软件平台,用于开发和部署生产级端到端代理 AI 管道,结合 Supermicro 在部署全球最大液冷数据中心方面的专业知识,为当今最雄心勃勃的 AI 数据中心项目提供卓越的效率和上线时间。
液冷或风冷:Supermicro NVIDIA HGX B200 系统
全新液冷 4U NVIDIA HGX B200 8-GPU 系统采用新开发的冷板和先进的管道设计,进一步提高了用于 NVIDIA HGX H100/H200 8-GPU 系统的前代产品的效率和可维护性。新的机架级设计与新的垂直冷却剂分配歧管 (CDM) 相辅相成,冷却能力是上一代的两倍多,同时保持相同的 4U 外形尺寸,可实现更密集的架构和灵活的配置场景,适用于各种数据中心环境。
Supermicro 为液冷数据中心提供 42U、48U 或 52U 机架配置。42U 或 48U 配置在一个机架中提供 8 个系统和 64 个 GPU,在五个机架中提供 256 个 GPU 可扩展单元。52U 机架配置允许在机架中使用 96 个 GPU,并在 9 个机架中支持 768 个 GPU 可扩展单元,以实现最先进的 AI 数据中心部署。Supermicro 还为大型部署提供行内 CDU 选项,以及不需要设施用水的液-空冷却机架解决方案。
Supermicro 的 NVIDIA HGX B200 系统原生支持 NVIDIA AI Enterprise 软件,以加快 AI 的生产时间。NVIDIA NIM 微服务使组织能够访问最新的 AI 模型,以便在任何地方(无论是在数据中心、云还是工作站)的 NVIDIA 加速基础设施上快速、安全、可靠地进行部署。
对于传统数据中心,还提供新的 10U 风冷 NVIDIA B200 8-GPU 系统,该系统具有重新设计的模块化 GPU 托盘,可将 NVIDIA Blackwell GPU 安装在风冷环境中。风冷机架设计沿袭了上一代久经考验的行业领先架构,在 48U 机架中集成了 4 个系统和 32 个 GPU,同时提供 NVIDIA Blackwell 性能。所有 Supermicro NVIDIA HGX B200 系统都配备了 1:1 的 GPU 与 NIC 比率,支持 NVIDIA BlueField-3 SuperNIC 或 NVIDIA ConnectX-7 NIC,可在高性能计算结构中进行扩展。
Supermicro 为 NVIDIA 认证系统计划中包含的系统提供支持。该计划将 NVIDIA GPU、CPU 和高速、安全的网络技术整合到领先 NVIDIA 合作伙伴的系统中,确保配置经过验证,以实现最佳性能、可靠性和可扩展性。通过选择 NVIDIA 认证系统,企业可以放心地选择硬件解决方案来支持其加速计算工作负载。NVIDIA 已认证配备 NVIDIA H100 和 H200 GPU 的 Supermicro 系统。
适用于 NVIDIA GB200 NVL72 的端到端液冷解决方案
Supermicro 的 SuperCluster 解决方案基于 NVIDIA GB200 NVL72 系统,结合了 Supermicro 的端到端液体冷却技术,代表了 AI 计算基础设施的突破。该系统在单个机架中集成了 72 个 NVIDIA Blackwell GPU 和 36 个 NVIDIA Grace CPU,通过 NVIDIA 迄今为止最广泛的 NVLink 网络提供百万兆级计算能力,实现 130 TB/s 的 GPU 通信。
48U 解决方案的多功能性支持液-空和液-液冷却配置,以适应各种数据中心环境。此外,Supermicro 的 SuperCloud Composer 软件提供用于监控和优化液冷基础设施的管理工具,提供从概念验证到全面部署的完整解决方案。
面向 NVIDIA Blackwell 的端到端数据中心解决方案和部署服务
从概念验证 (PoC) 到全面部署,Supermicro 是具有全球制造规模的全面一站式解决方案提供商,提供所有必要的组件、数据中心级解决方案设计、液体冷却技术、网络解决方案、布线、管理软件、测试和验证以及现场安装服务。
其内部液体冷却生态系统提供了完整的定制设计热管理解决方案,包括针对 GPU、CPU 和内存模块的优化冷板,以及多功能冷却剂分配单元外形尺寸和容量、歧管、软管、连接器、冷却塔以及复杂的监控和管理软件。Supermicro 的生产设施遍布圣何塞、欧洲和亚洲,为液冷机架系统提供无与伦比的制造能力,确保及时交付,降低总拥有成本 (TCO) 和环境影响,并实现一致的质量。
声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。