黄仁勋烤箱里端出全球最大7nm芯片英伟达第八代安培GPU A100发布AI算力提升20倍如同神奇手术

新冠疫情突如其来的打乱了全球科技公司的产品发布计划，英伟达（NVIDIA）便是其中之一，他们原本计划在2020年的GTC大会上展示安培（Ampere）架构，但最终不得不推迟。直到今天，英伟达CEO黄仁勋终于带来了这一重大更新——基于安培架构的GPU A100，以及面向边缘AI计算的EGX A100。

值得一提的是，在家中45天后，黄仁勋利用厨房录制演讲视频成功完成了2020 GTC的主题演讲和新品发布，这一举动无疑展现了他对技术和创新追求的坚定信念。

安培架构GPU A100是目前全球最大的7nm芯片，其面积高达826平方毫米，集成了540亿个晶体管。这款芯片相比Volta架构实现了惊人的20倍性能提升，并且能够同时满足AI训练和推理需求。由8个A100 GPU组成的NVIDIA DGX A100 AI系统单节点性能达到创纪录5 petaflops，是当前市场上最高性能的一款AI系统。

第八代安培GPU架构不仅提供了迄今为止最大规模的性能飞跃，而且还将AI训练与推理功能完美融合。黄仁勋强调：“Ampere架構設計為第八代GPU帶來了至今最大規模的人才飛躍，並將訓練與推理功能結合起來。此外，它們對前代產品進行20倍提升，這在歷史上首次能夠實現横向扩展以及纵向扩展负载加速。”

此外，A100还具备四大关键特性：TF32第三代Tensor Core核心、多实例GPU-MG技术、第三代 NVIDIA NVLink互联技术以及结构化稀疏效率技术。这使得A100成为各种高要求工作负载，如科学模拟、对话式AI、推荐系统、高性能数据分析等领域不可或缺的一项工具。

DGX A100系统采用弹性计算能力，可以根据每项工作分配适量计算力，每个A100 GPU可分割为多达七个独立实例执行推理任务；第三代NVLink互联技术可以将多个A100 GPU组合成一个巨大的GPU执行更大规模训练任务；最后，由于它既可以做训练也能做推理，使其成为处理复杂算法如BERT模型时极佳选择。在BERT模型训练方面，比Telsa V100提升6倍，而在BERT模型推理方面则提升7倍。

总之，本次GTC 2020中的重磅产品不仅具有令人瞩目的硬件规格，还通过其灵活性的三层面来支持用户需求，无论是在数据中心还是边缘部署，都有着显著地优势。