黄仁勋烤箱里端出全球最大7nm芯片英伟达第八代安培GPU A100发布AI算力提升20倍如同神奇手术
新冠疫情突如其来的打乱了全球科技公司的产品发布计划,英伟达(NVIDIA)便是其中之一,他们原本计划在2020年的GTC大会上展示安培(Ampere)架构,但最终不得不推迟。直到今天,英伟达CEO黄仁勋终于带来了这一重大更新——基于安培架构的GPU A100,以及面向边缘AI计算的EGX A100。
值得一提的是,在家中45天后,黄仁勋利用厨房录制演讲视频成功完成了2020 GTC的主题演讲和新品发布,这一举动无疑展现了他对技术和创新追求的坚定信念。
安培架构GPU A100是目前全球最大的7nm芯片,其面积高达826平方毫米,集成了540亿个晶体管。这款芯片相比Volta架构实现了惊人的20倍性能提升,并且能够同时满足AI训练和推理需求。由8个A100 GPU组成的NVIDIA DGX A100 AI系统单节点性能达到创纪录5 petaflops,是当前市场上最高性能的一款AI系统。
第八代安培GPU架构不仅提供了迄今为止最大规模的性能飞跃,而且还将AI训练与推理功能完美融合。黄仁勋强调:“Ampere架構設計為第八代GPU帶來了至今最大規模的人才飛躍,並將訓練與推理功能結合起來。此外,它們對前代產品進行20倍提升,這在歷史上首次能夠實現横向扩展以及纵向扩展负载加速。”
此外,A100还具备四大关键特性:TF32第三代Tensor Core核心、多实例GPU-MG技术、第三代 NVIDIA NVLink互联技术以及结构化稀疏效率技术。这使得A100成为各种高要求工作负载,如科学模拟、对话式AI、推荐系统、高性能数据分析等领域不可或缺的一项工具。
DGX A100系统采用弹性计算能力,可以根据每项工作分配适量计算力,每个A100 GPU可分割为多达七个独立实例执行推理任务;第三代NVLink互联技术可以将多个A100 GPU组合成一个巨大的GPU执行更大规模训练任务;最后,由于它既可以做训练也能做推理,使其成为处理复杂算法如BERT模型时极佳选择。在BERT模型训练方面,比Telsa V100提升6倍,而在BERT模型推理方面则提升7倍。
总之,本次GTC 2020中的重磅产品不仅具有令人瞩目的硬件规格,还通过其灵活性的三层面来支持用户需求,无论是在数据中心还是边缘部署,都有着显著地优势。