新的 MLPerf Storage v1.0 基准测试结果表明,存储系统在 AI 模型训练性能中发挥着关键作用
随着加速器技术的进步和数据集规模的不断增加,ML 系统提供商必须确保其存储解决方案能够满足计算需求。...
Nebius 开源 Soperator ,可优化 AI 和 HPC 工作负载的 Slurm
用于 Slurm 的全功能 Kubernetes 运算符,旨在优化现代机器学习 (ML) 和高性能计算 (HPC) 环境中的工作负载管理和编排。...
UALink 联盟将于年底成立并发布新的GPU连接标准
这个被称为 Ultra Accelerator Link (UALink) 的初始小组将定义并建立一个开放的行业标准,使 AI 加速器能够更有效地进行通信。...
Fluid Dynamic Sciences 亮相NVIDIA GTC 2024,引领下一代计算流体动力学
Fluid Dynamic Sciences利用创新的 AI 和 GPU提供了一种更智能、更快速、更可持续的流体动力学方法。...
HPE GreenLake 推出全新高密度闪存选项,面向大型企业 AI 和数据湖
这些改进使 HPE 能够将 AI 规模的吞吐量提高两倍,并将功耗降低多达 50%。...
欧洲核子研究中心在法国开设新数据中心,以提高大型强子对撞机的计算能力
这是一个由分布在40多个国家的约170个数据中心组成的合作项目,存储容量约为3 EB,整个网络有100万个CPU内核。...
新的替代 AI 模型:GPU 数量减少 10-100 倍,但结果相同
在市场转向 GenAI(例如 ChatGPT)之前,传统的神经网络是许多人关注技术方向。这些类型的神经网络的特点是具有一些“短期”记忆,被称为递归神经网络或RNN。它们在许多&...
Argonne 研究人员增强 MadGraph 代码以应对下一代超级计算挑战
作为一个框架,MadGraph旨在建立一个完整的标准模型和超越标准模型的现象学,包括横截面计算以及事件操作和分析等元素。...
Cerebras开放 4 exaFLOP 算力,支持美国政府研究人员训练AI模型
这种前所未有的计算能力将使 NAIRR Pilot 研究人员能够在 Cerebras 上训练 AI 模型,而不是在传统 GPU 集群上训练数月。...
美光:使用 HPC 解决全球最大挑战
为了协助高速数据收集,CERN CMS 将使用基于 CXL 标准的美光 CZ120 内存扩展模块来改进 L1 Scouting 的摄取和数据处理链。
...
在 HPC 大海捞针:使用 AI 大规模监控异常
在人工智能算法 (AI) 的帮助下,该系统能够精确识别故障组件(节省寻找干扰原因和后果的宝贵时间)、检测难以检测的问题,甚至预测它们。...
新一代国产超级计算系统“天河星逸”发布,较“天河二号”实现倍增
“天河星逸”在通用 CPU 计算能力、网络能力、存储能力以及应用服务能力等多方面较“天河二号”实现倍增。...
Yotta Data Services 与 NVIDIA 合作,推动印度的 AI 转型
Yotta 推出 Shakti-Cloud:印度最大的 16 Exaflops AI 计算能力超级计算机,配备 NVIDIA H100 Tensor Core GPU。
...
Tachyum称有人将用其尚未完成的芯片制造50 exaFLOPS超算
处理器设计者声称,即将推出的系统将能够为大型语言模型提供 8 zetaFLOPS 的 AI 性能,并在 2025 年完成时拥有数百 PB 的 DDR5 内存。...