英伟达三芯策略初见成效ISC2022盛会上芯片解密公司代表受邀演讲
英伟达的“三芯”战略初见成效,ISC 2022盛会上系统公司代表展现多样化合作成果
在过去几年中,人们讨论的焦点仅限于GPU,而随着CPU和DPU的引入,英伟达作为系统公司能谈及的话题变得更加丰富。 Computex 和 ISC 2022(国际超级计算机大会)的展示不仅证明了“三芯”策略的初步成功,也展现了英伟达在混合量子计算领域的前瞻布局。
CEO黄仁勋强调,英伟达是一家提供从硬件到系统软件全栈解决方案的公司,其产品能够满足客户需求。加速计算与CPU有本质区别,我们提供独特且特别适用于加速任务。
那么,“三芯”的具体运作是如何加速那些世界上最快加速系统?答案就是独特的CPU+GPU组合。在GTC 22上,最新一代Hopper架构GPU H100发布,它实现了性能提升,与两年前的Ampere架构A100 GPU相比,更高效地处理数据推理任务。
然而,市场上的优秀CPU产品让Grace CPU更显得突出。它旨在通过更高效地处理大量数据与AI任务,并且紧密结合GPU,以此来解决与数据处理相关的问题。当被问及Grace CPU独特之处时,黄仁勋指出,它集成了两个基于Arm核心,有144个Neoverse核心,同时支持PCIe Gen5协议,可以实现最高性能连接。
由此可见,在设计过程中,就已经明确要将所有硬件产品之间进行互联。这也是随着摩尔定律放缓而成为趋势异构计算的一种体现。作为高性能计算产品供应商,英伟达这样的布局十分合理。
美国阿拉莫斯国家实验室宣布,将率先采用NVIDIA Grace CPU技术,这一新型号预计AI性能超过10 exaflops。此外,还有瑞士国家计算中心计划使用Grace CPU和GPU服务器。
DPU带来的大幅度性能提升也值得关注,它可以将通信和计算负载从CPU卸载,从而获得巨大的性能提升。不过,这些具体表现仍需实践验证。在ISC 2022期间,为期多年的广泛合作显示了DPU对LANL热门编程模型运行速度提高21%能力。而俄亥俄州立大学研究人员则展示了DPU如何提高P3DFFT数学库运行速度。
对于HPC仿真应用,如药物研发或飞机设计等,可获得两位数甚至更多次方级别的加速。此外,不同研究团队正利用BlueField DPU 加速 MPI 和其他 HPC 工作负载。
除了这些成就之外,一直以来的“三芯”策略已经开始产生效果,不同硬件组合已在HPC、AI等应用中实现显著提升。此外,在量子计算领域,也有所探索。虽然存在挑战,但英国奈米技术中心正使用 NVIDIA cuQuantum 软件开发套件,加速其量子电路模拟工作负载。