Graphcore推出用于AI工作负载的下一代智能处理单元-存储器/芯片-中国存储网

2020-07-17 16:46:27

来源
科技号

IPU-Machine M2000。借助新的M2000，Graphcore承诺“将具有更大的处理能力，更多的内存和内置的可伸缩性，以处理非常大的机器智能工作负载。

英国硬件设计公司Graphcore于2016年悄然崛起，推出了第一代智能处理单元（IPU），该公司宣布了其下一代IPU平台：IPU-Machine M2000。借助新的M2000，Graphcore承诺“将具有更大的处理能力，更多的内存和内置的可伸缩性，以处理非常大的机器智能工作负载。” 该平台现已开始预购，将于2020年底开始批量生产。

第二代IPU机器（M2000）。图片由Graphcore提供。

M2000计算刀片（Graphcore称之为“即插即用”）通过Graphcore的四个新的7nm Colossus Mk2 GC200 IPU处理器提供了1千万亿浮点数的“机器智能”计算能力，每个处理器都包含1,472个独立的IPU内核，并且超过架构中的594亿个晶体管Graphcore称之为“有史以来最复杂的处理器”。GC200在处理器内部还包含一个“前所未有的” 900 MB高速SRAM，与Graphcore的第一代IPU相比，速度提高了三倍。

该系统由Graphcore的Poplar软件堆栈支持，允许用户在Poplar组装计算图和必要的运行时程序时应用其首选的AI框架。第二代系统与Graphcore的第一代Mk1 IPU产品完全向后兼容-当然，速度提高了八倍。

Graphcore开发的一种新的浮点格式称为 AI-Float，可为机器学习计算调整能量和性能。F P32 IEEE浮点算法通过FP16.32（16位乘以32位累加）和FP16.16（16位乘累加）得到支持，但是Graphcore指出，通过使用随机舍入，Colossus Mk2 IPU可以将所有算术保持在16位格式，从而“减少内存需求，节省读写能量，并减少算术逻辑中的能量，同时提供完全准确的机器智能结果。” Graphcore表示，AI-Float还为稀疏算术浮点运算提供了本机支持。

Graphcore通过其1U超薄刀片设计强调了M2000的可扩展性。扩展到超过八台M2000的配置将使用Graphcore的机架式IPU-POD 64 ，该IPU-POD 64 包含内置在19英寸机架中的16台M2000，可提供高达16 exaflops的（AI-Float）机器智能计算性能。

对于这种规模的连接，Graphcore正在使用其新的低延迟IPU-Fabric技术，该技术表示“在将通信延迟从10个IPU扩展到成千上万个IPU的同时，可使通信延迟接近恒定。” 用户将能够选择自己喜欢的CPU和IPU（通过以太网连接）的组合，他们将能够使用Graphcore的Virtual-IPU工具动态地配置这些IPU。

虽然要到第四季度才能开始全面供货，但Graphcore仍在吹捧许多早期客户，包括微软，牛津大学，劳伦斯伯克利国家实验室，Atos和Simula研究实验室。

“我们与Graphcore合作，使他们的Mk2 IPU系统产品，包括IPU-Machine M2000和IPU-POD横向扩展系统，可为我们的客户（特别是大型欧洲实验室和机构）使用，”战略与业务部高级副总裁Arnaud Bertrand说道。 Atos大数据系统的研发。“我们已经在计划与欧洲的早期客户一起为他们的AI研究项目构建IPU集群。IPU的新架构可以提供一种更有效的方式来运行AI工作负载，这适合Atos的脱碳计划，我们很高兴与欧洲AI半导体公司合作，共同实现这一未来。”

通过第二次齐售，Graphcore旨在破坏Nvidia在竞争日益激烈的AI芯片市场中的市场领导地位-他们可能会有不错的表现。Moor Insights＆Strategy AI高级分析师Karl Freund表示：“有了这一新产品，Graphcore可能现在就成为向Nvidia挑战数据中心AI的第一人，至少在大规模培训方面如此。”

声明： 此文观点不代表本站立场；转载须要保留原文链接；版权疑问请联系我们。

Graphcore推出用于AI工作负载的下一代智能处理单元

联发科发布天玑1000C 5G处理器：专供美国、网速砍一半

北斗带动国产芯片发展：一年内普及22nm，将领先 GPS 两代工艺

台积电年度技术论坛将至，市场聚焦3nm试产及未来2nm的技术路径

初创芯片公司Blaize首次推出AI模块，用于机器学习

中芯国际宣布：无法向华为“供货”，那么华为怎么办？

N2W 宣布为 Kubernetes 提供下一级别自动备份与恢复功能

Cloudflare 3周2宕，宕机事件暴露了人工智能和支付依赖的风险

嵌入式安全：嵌入式系统制造商如何通过安全启动密钥管理加强保护

X平台发布全新“Chat”功能，新增端到端加密与视频通话

PostgreSQL 数据库开源接口 pgAdmin4 中发现严重的远程代码执行（RCE）漏洞

Wasabi 推出隐蔽复制功能，提升云存储安全，防勒索软件

HostColor 在迈阿密数据中心推出新的 AI 兼容云和裸机服务器

Inveniam 收购 Storj 为去中心化数据基础设施的未来提供动力

Smash 专为创意社区设计的新服务取代传统文件传输

ASI Solutions 推出 InfiniStor 云存储平台

我国科学家在量子体系中实现突破商业化落地迎关键拐点

江门中微子实验精度提高1.5~1.8倍

2030 年比特币会被量子计算机攻破吗？

NODKA IPC-615H5-Q670利用英特尔的处理和工具集提高性能

LDRA 宣布其 LDRA 工具套件现在支持对多核架构上的时序耦合干扰的增强分析

谷轮赋能中国绿色数据中心建设，打造面向未来的制冷解决方案

美光战略调整，彻底退出消费级内存市场，2026年起停售DDR内存和SSD

电源和冷却限制是未来三到五年人工智能数据中心增长的重大障碍

慧荣科技宣布推出SM8388，业界领先的高能效PCIe Gen5企业SSD主控芯片

Supercomputing 2025：西部数据将展示创新的下一代AI存储

天硕工业级宽温存储方案：智能SLC模式助力关键领域国产化替代

为AI时代打造的 Pure Storage平台，让数据更智能、更快、更安全、更有趣

和硕通过先进的 OCP 解决方案为数据中心的未来提供动力

江苏:县级以下禁止开发政务服务APP

瑞金医院联合华为开源RuiPath病理模型，加速行业智能化落地

科技要闻

Microchip推出数字功率监测器，实现便携式设备测量功耗减半

全球半导体设备市场统计报告：出货量330亿美元，中国占额最大

CISP认证全面介绍，CISP报名条件及培训课程介绍

芯展速“臻·6”发布会圆满礼成国内首发Gen6路标加速「多模态」真正落地

谷轮赋能中国绿色数据中心建设，打造面向未来的制冷解决方案

Graphcore推出用于AI工作负载的下一代智能处理单元

猜你喜欢

科技要闻