MemVerge 和 Micron 利用 CXL 内存大幅提高 NVIDIA GPU 利用率-AI算力-中国存储网

2024-03-19 22:10:09

来源
中存储

该解决方案利用 CXL 内存的智能分层，通过从 GPU HBM 卸载到 CXL 内存来提高大型语言模型（LLM）的性能。

作为 AI 优先大内存软件的领导者，MemVerge 与美光联手推出了一项突破性的解决方案，该解决方案利用 CXL 内存的智能分层，通过从 GPU HBM 卸载到 CXL 内存来提高大型语言模型（LLM）的性能。这项创新合作将在 GTC 的美光展位 #1030 展出，与会者可以亲眼目睹分层内存对 AI 工作负载的变革性影响。

MemVerge 首席执行官兼联合创始人 Charles Fan 强调了克服 HBM 产能瓶颈的至关重要性。“经济高效地扩展 LLM 性能意味着让 GPU 获得数据，”Fan 说。“我们在 GTC 上的演示表明，分层内存池不仅可以提高性能，还可以最大限度地利用宝贵的 GPU 资源。”

该演示由 MemVerge 和美光的工程师进行，采用了 FlexGen 高吞吐量生成引擎和 OPT-66B 大型语言模型，该模型在配备 AMD Genoa CPU、Nvidia A10 GPU、Micron DDR5-4800 DIMM、CZ120 CXL 内存模块和 MemVerge Memory Machine X 智能分层软件的 Supermicro 千万亿次级服务器上运行。

MemVerge 和 Micron 利用 CXL 内存大幅提高 NVIDIA GPU 利用率

演示的结果令人印象深刻。与传统的 NVMe 存储方法相比，利用分层内存的 FlexGen 基准测试在不到一半的时间内完成任务。同时，GPU 利用率从 51.8% 飙升至 91.8%，这要归功于 MemVerge Memory Machine X 软件促进的跨 DIMM 和 CXL 模块的数据分层的透明管理。

MemVerge、美光和 Supermicro 之间的合作标志着在提升 AI 工作负载能力方面的一个重要里程碑，使组织能够实现前所未有的性能、效率和洞察时间水平。通过利用 CXL 内存和智能分层的强大功能，企业可以释放新的创新机会，并加速实现 AI 驱动的成功之旅。

通过与 MemVerge 的合作，美光能够展示 CXL 内存模块在提高 AI 应用的有效 GPU 吞吐量方面的巨大优势，从而更快地为客户提供见解。美光在内存产品组合中的创新为计算提供了必要的内存容量和带宽，以将 AI 用例从云扩展到边缘，“美光高级副总裁兼计算和网络业务部总经理 Raj Narasimhan 说。

关于MemVerge

MemVerge是大内存计算软件的先驱开发商。在云端或本地，数据密集型工作负载运行速度更快，成本更低，并且借助该公司屡获殊荣的 Memory Machine 产品自动恢复。Memory Machine X 有望彻底改变未来 CXL 内存的使用方式，而 Memory Machine Cloud 则凭借其不断调整云成本和性能的能力脱颖而出。

声明： 此文观点不代表本站立场；转载须要保留原文链接；版权疑问请联系我们。

MemVerge 和 Micron 利用 CXL 内存大幅提高 NVIDIA GPU 利用率

AMD为中国定制的Instinct MI309 GPU未通过美国政府的出口许可证测试

NVIDIA 聚焦 EOS 超级计算机，配备超过 4,600 个 H100 GPU，用于下一代 AI 计算

新的替代 AI 模型：GPU 数量减少 10-100 倍，但结果相同

Meta AI 计划公布：600000 个 Nvidia GPU的算力水平

超微 Supermicro 新发布服务器，号称业界最紧凑的高性能 GPU 服务器

N2W 宣布为 Kubernetes 提供下一级别自动备份与恢复功能

Cloudflare 3周2宕，宕机事件暴露了人工智能和支付依赖的风险

嵌入式安全：嵌入式系统制造商如何通过安全启动密钥管理加强保护

X平台发布全新“Chat”功能，新增端到端加密与视频通话

PostgreSQL 数据库开源接口 pgAdmin4 中发现严重的远程代码执行（RCE）漏洞

Wasabi 推出隐蔽复制功能，提升云存储安全，防勒索软件

HostColor 在迈阿密数据中心推出新的 AI 兼容云和裸机服务器

Inveniam 收购 Storj 为去中心化数据基础设施的未来提供动力

Smash 专为创意社区设计的新服务取代传统文件传输

ASI Solutions 推出 InfiniStor 云存储平台

我国科学家在量子体系中实现突破商业化落地迎关键拐点

江门中微子实验精度提高1.5~1.8倍

2030 年比特币会被量子计算机攻破吗？

NODKA IPC-615H5-Q670利用英特尔的处理和工具集提高性能

LDRA 宣布其 LDRA 工具套件现在支持对多核架构上的时序耦合干扰的增强分析

谷轮赋能中国绿色数据中心建设，打造面向未来的制冷解决方案

美光战略调整，彻底退出消费级内存市场，2026年起停售DDR内存和SSD

电源和冷却限制是未来三到五年人工智能数据中心增长的重大障碍

慧荣科技宣布推出SM8388，业界领先的高能效PCIe Gen5企业SSD主控芯片

Supercomputing 2025：西部数据将展示创新的下一代AI存储

天硕工业级宽温存储方案：智能SLC模式助力关键领域国产化替代

为AI时代打造的 Pure Storage平台，让数据更智能、更快、更安全、更有趣

和硕通过先进的 OCP 解决方案为数据中心的未来提供动力

江苏:县级以下禁止开发政务服务APP

瑞金医院联合华为开源RuiPath病理模型，加速行业智能化落地

科技要闻

Microchip推出数字功率监测器，实现便携式设备测量功耗减半

全球半导体设备市场统计报告：出货量330亿美元，中国占额最大

CISP认证全面介绍，CISP报名条件及培训课程介绍

芯展速“臻·6”发布会圆满礼成国内首发Gen6路标加速「多模态」真正落地

谷轮赋能中国绿色数据中心建设，打造面向未来的制冷解决方案

MemVerge 和 Micron 利用 CXL 内存大幅提高 NVIDIA GPU 利用率

猜你喜欢

科技要闻