国外媒体报道,在线零售业巨头亚马逊已经将众多NP问题嵌套起来,希望搞清楚如何用最少时间或最低资源投入从全美各处仓库中提取特定商品交付到买家手中,这需要极高的计算强度和频繁的应用需求。
亚马逊旗下云计算部门亚马逊云科技于2021年10月,在加利福尼亚理工学院投资兴建了AWS量子计算中心,希望寻求可行的求解器选项。面对大量有限元分析程序和电磁模拟工具,亚马逊还决定在GitHub上建立Palace开源项目,并建立相应的社区。
Palace的全称为Parallel Large Scale Computational Electromagnetics,即大规模计算电磁学。“麦克斯韦奇妙方程”的宏观形式相信很多人在大学中已经有所接触,但面向原子水平的微观形式完全是另一个世界,而且又是超导量子芯片的设计基础。不过AWS别无选择,为了帮助亚马逊找到超大规模场景下的推销员差旅优化之解,同时将解决成本控制在合理水平,他们必须全力以赴。
AWS已经开放一项量子计算服务,名为Bracket,可供企业客户配合现有IonQ、OQC、Rigetti、Xanadu、QuEra等设备一同使用(但很奇怪,支持清单中没有出现D-Wave Systems)。母公司亚马逊肯定已经用上了这些设备,而且鼓励AWS将其以服务形式开放给用户,这样我们所有人都能为亚马逊的量子计算探索分摊一点成本。亚马逊的战略意图一直没有清晰:正如其认定需要CPU SoC层级的创新来改进服务器设计,包括以Arm架构为基础打造Nitro DPU和Graviton CPU;亚马逊知道推动量子计算创新的唯一道路,就是设计自己的超导量子计算芯片。
而最终带来的成果不只是AWS量子处理器,还包括研究员Sebastian Grimberg提出的“超导量子计算芯片”这个术语。目前还不清楚AWS在量子芯片设计中采用了怎样的方法,又获得了怎样的成效;唯一可以肯定的,就是对AWS而言现有工具成本过高,根本没办法应用于大规模计算。
AWS高性能计算(HPC)总经理、HPC系统长期用户兼设计师Ian Colle表示,“这是个非常困难的问题,其中纠错机制极具挑战性。我们的量子计算团队意识到这一差距的存在,市面上的相关工具也过于昂贵。所以基于部分开源成果,我们决定向其中引入智能,借此创建出新的、性能更高的工具,有望在规模求解器上构建起量子计算机。”
最终诞生的Palace求解器目前可在Arm CPU和x86 CPU上运行,但量子计算中心高级研究科学家Grimberg表示,Palace所能实现的不止于电磁模拟,更适用于流体动力学、计算流体动力学等领域的高复杂度微分方程。Grimberg拥有斯坦福大学航空与宇航学博士学位,应用研究科学家Hugh Carson则凭借对计算流体动力学的研究获得了麻省理工计算科学博士学位。从这个角度看,亚马逊应该是对计算流体动力学也抱有兴趣。
AWS在博文中展示了Palace的功能,即通过粗细网格模型模拟和读取transmon(频率可调的谐振器)量子比特,借此实现物理效应仿真。目前我们关注的是模拟当中壁钟时间的相互作用,以及用于transmon量子比特及其谐振器模拟的核心数量。此外,AWS的研究重点还包括Graviton 3(C7g)与Graviton 2(C6g)实例对基于x86架构实例的模拟,还有如何通过更多核心在有限元模拟中扩展自由度。
下图所示,为1550万个自由度的模拟中,为粗网格模型添加更多核心时的壁钟时间与提速因数:
至于对于使用Palace求解器的应用程序,Graviton芯片已经足以抗衡最新一代至强SPS,但尚不清楚为什么C5N实例中的“Skylake”至强SP也有类似的性能表现(如图)。
下图为具有2.462亿个自由度的较高分辨率模拟,这需要将核心数量增加了几千个,整个运行周期也延长到了约12分钟(粗网格模型为1.4分钟)。很明显,15.8倍的自由度提升成本不菲:
为了推动Palace稳步发展,AWS量子团队基于一系列集总元件微波谐振器进行了超导超颖材料波导模拟——听不懂没关系,熟悉这种艰深概念的话亚马逊肯定要给各位提供个岗位了。其基本思路是以1 MHz为增量预测波导在4 GHz至8 GHz范围内的传输特性,并以2.422亿个自由度为起点进行缩放测试,单一超颖材料的单一晶格为14亿个自由度,共涉及21个超颖材料晶格。整个模拟完全在C6gn Graviton 2实例中进行,总计200个实例可提供最多12800个核心,如图所示:
上图所示为自适应和均匀两种采样模式,有趣的是Palace求解器确实能够在12800个Graviton 2核心上进行扩展。据推测,AWS拿不出足够的Graviton 3核心来进行C7g实例测试。但如果可以,壁钟时间应该会有所降低、仍可扩展至全部核心、测线陡峭度也相同。
顺带一提,这些测试中使用的实例是由AWS开发的ParallelCluster工具设置的,能够轻松通过汇聚多个节点建立起虚拟MPI集群,从而运行Palace求解器。
至于什么时候才能看到AWS自家原研的量子芯片,暂时还不得而知,估计短时间内可能性不大。
Colle总结道,“我们正努力开发属于自己的量子计算机。目前我能说的就这么多,只要确定计划可行,我们会立即将成果推向市场。”
声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。