2025-02-14 08:33:41
来 源
中国存储网
存储资讯
这款 HPE 机架级系统旨在帮助服务提供商和大型企业快速部署非常大型的复杂 AI 集群,并采用先进的直接液体冷却解决方案来优化效率和性能。

中存储消息,15日慧与(HPE) 宣布,其首款基于 NVIDIA Blackwell 系列的解决方案 NVIDIA GB200 NVL72 现已出货。这款 HPE 机架级系统旨在帮助服务提供商和大型企业快速部署非常大型的复杂 AI 集群,并采用先进的直接液体冷却解决方案来优化效率和性能。

HPE 宣布推出其首款 NVIDIA Grace Blackwell 系统

“AI 服务提供商和大型企业模型构建者在提供可扩展性、极致性能和快速部署时间方面承受着巨大压力,”HPE HPC 和 AI 基础设施解决方案高级副总裁兼总经理 Trish Damkroger 说。“作为全球三大最快直接液体冷却系统的构建者,HPE 凭借行业领先的服务专业知识,为客户提供更低的每令牌培训成本和一流的性能。”

NVIDIA GB200 NVL72 采用共享内存、低延迟架构,采用最新的 GPU 技术,专为在一个内存空间中具有超过 1 万亿个参数的超大型 AI 模型而设计。GB200 NVL72 提供 NVIDIA CPU、GPU、计算和交换机托盘、网络和软件的无缝集成,将极致性能结合在一起,以处理高度可并行化的工作负载,例如生成式 AI (GenAI) 模型训练和推理,以及 NVIDIA 软件应用程序。

“工程师、科学家和研究人员需要尖端的液体冷却技术来满足不断增长的功率和计算需求,”NVIDIA 企业平台副总裁 Bob Pette 说。“在 HPE 和 NVIDIA 之间持续合作的基础上,HPE 的第一批 NVIDIA GB200 NVL72 将帮助服务提供商和大型企业高效构建、部署和扩展大型 AI 集群。”

随着电源需求和数据中心密度动态的不断升级,HPE 拥有五十年的液体冷却专业知识,使公司具有独特的优势,可以帮助客户为复杂的液体冷却环境提供快速部署和广泛的基础设施支持系统。这一经验使 HPE 能够交付 Green500 榜单前 15 名超级计算机中的 8 台,该榜单对全球能效最高的超级计算机进行了排名。HPE 是公认的直接液体冷却技术领导者,在全球最快的 10 台超级计算机中,HPE 制造了 7 台。

HPE 的 NVIDIA GB200 NVL72 的特点:

  • 72 个 NVIDIA Blackwell GPU 和 36 个 NVIDIA Grace CPU 通过高速 NVIDIA NVLink 互连。
  • 高达 13.5 TB 的总 HBM3e 内存,带宽为 576 TB/秒。
  • HPE 直接液体冷却技术。

行业领先的服务和支持

HPE 能够在全球范围内提供 AI 解决方案,经验证能够支持大规模自定义 AI 集群,并具有卓越的可维护性,包括专家现场支持、定制服务、可持续性服务等。HPC & AI 定制支持服务是为满足客户需求量身定制的。HPE 具有多个级别的 SLA 覆盖范围,通过专门的远程工程师提供主动支持,从而提供增强的事件管理,确保快速安装并更快地实现价值。

可用的服务包括:

  • 现场工程资源:由训练有素的常驻工程师提供全面的现场支持,他们与客户的 IT 团队密切合作,以确保最佳的系统性能和可用性。
  • 性能和基准测试项目:行业领先的专家团队,在系统的整个生命周期内微调解决方案。
  • 可持续发展服务:能源和排放报告、可持续发展研讨会和资源监测,以减少对环境的影响。

HPE 新推出的 NVIDIA GB200 NVL72 是众多高性能计算和超级计算系统之一,可满足 GenAI、科学发现和其他计算密集型工作负载的所有用例。详细了解 NVIDIA AI Computing by HPE 产品组合中的计算和超级计算系统以及其他解决方案。

声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。