人物在芯片采购网站探索中发现英伟达三芯策略初步奏效的启示ISC 2022报告显示其影响力扩大
在过去的几年中,人们主要讨论的是GPU,但随着CPU和DPU的出现,英伟达如今能够谈论的话题变得更加丰富。在刚刚结束的Computex和ISC 2022上,英伟达展示了它们最新的GPU、CPU和DPU合作成果,这显示出英伟达“三芯”策略已经取得初步成效。此外,在混合量子计算领域的进展,也体现了英伟达在高性能计算领域布局的前瞻性。
黄仁勋CEO强调:“我们是一家系统公司,从硬件到软件,我们提供全栈解决方案。客户可以根据自己的需求选择我们的产品。”他还解释说,“加速计算世界与CPU截然不同,我们提供独特的产品和解决方案。”
那么,如何看待英伟达“三芯”策略在加速这些最快加速系统中的作用?这涉及到独特的CPU+GPU组合。GPU作为英伟达发明的一项技术,也是其标志性的产品。在GTC 22上,雷峰网介绍了Hopper架构新一代H100 GPU,它相比两年的Ampere架构A100 GPU实现了显著性能提升。
黄仁勋表示,只需20个H100 GPU,就能承载全球互联网流量,使客户能够推出先进推荐系统以及实时运行大型语言模型数据推理。这表明GPU在AI任务处理方面具有巨大的潜力。不过,与之相比,Grace CPU更引人注目。市场上已有多款优秀CPU,但Grace CPU让人感到意外,并且好奇它具体如何区别于其他产品。
当被问及Grace CPU独特之处时,他回答:“Grace旨在比传统CPU更好地解决与数据处理相关的问题,可以高效处理大量数据,并且与我们的GPU紧密结合,更好地完成AI任务。” Grace CPU集成了两个基于Arm核心,有144个高性能Neoverse核心,还带有可伸缩矢量扩展和1 TB/s内存子系统支持最新PCIe Gen5协议,可实现最高性能连接,同时也能连接NVIDIA ConnectX-7智能网卡以及NVIDIA BlueField-3 DPU。
由此可见,当设计Grace CPU时,其就已经考虑到了将所有硬件产品之间进行良好的互联。这也容易理解,因为随着摩尔定律放缓异构计算成为未来趋势,而作为提供高性能计算产品公司,英伟达这样的布局十分合理。ISC 2022上,其CPU+GPU组合获得认可,如美国阿拉莫斯国家实验室(LANL)宣布,将率先采用NVIDIA Grace CPU技术,以及瑞士国家超级计算中心(CSCS)的Alps项目等,都将使用这种超级芯片组合来推动AI性能超过10 exaflops。
DPU带来的大幅度性能提升也是一个重要话题,它允许通信负载从CPU卸载,以获得巨大的速度优势。不过DPU具体能带来的提升仍需通过实践证明。而ISC 2022为此给出了些案例,如洛斯阿拉莫斯国家实验室(LANL)的杰出科学家Poole正与英伟达合作,将多物理应用性能提高30倍;俄亥俄州立大学研究人员展示了如何通过卸载消息传递接口(MPI)的关键部分,加速P3DFFT数学库运行速度21%;欧洲多个研究团队正在利用BlueField DPU加速MPI和其他HPC工作负载等。
除了这些成果,上述提到的量子计算领域也是英国华纳科技公司的一个重点区域,他们致力于开发用于模拟分子的行为的大型机器学习模型,以帮助化学家预测化合物属性并发现新的药物候选分子。此外,他们还计划开发一种名为"Quantum Circuit Learning" (QCL) 的新方法,该方法利用深度学习算法来优化量子电路,从而提高他们对复杂问题求解能力。此类方法对于探索未知材料或药物具有巨大的潜力,并可能极大地简化目前需要数百小时甚至数天才能完成的大规模仿真过程。