后方格智能化观察网
首页 > 测评 > 黄仁勋带领中国芯片革命全球最大7nm芯片在烤箱里诞生英伟达A100发布AI算力爆增20倍

黄仁勋带领中国芯片革命全球最大7nm芯片在烤箱里诞生英伟达A100发布AI算力爆增20倍

在全球疫情的阴影下,英伟达CEO黄仁勋带领团队发表了令人瞩目的新一代GPU架构安培(Ampere)及其基于此架构的GPU A100。这个7nm芯片面积高达826平方毫米,集成了540亿个晶体管,是目前全球最大的7nm芯片。相比Volta架构,它实现了高达20倍的性能提升,并且能够同时满足AI训练和推理的需求。

第八代安培GPU架构性能提升高达20倍

安培是英伟达继2018发布的Turing(图灵)架构之后的最新一代GPU架构,也是英伟达推出的第八代GPU架构。黄仁勋表示:“Ampere架構的突破性設計為英偉達第八代GPU提供了迄今為止最大的性能飞跃,集AI訓練和推理于一身,並且其性能相比於前代產品提升了高達20倍。这是有史以來首次,可以在一個平台上實現對橫向擴展以及縱向擴展負荷加速。”A100將在提高吞吐量同時,降低數據中心成本。

除了这些关键特性外,这款芯片还具备TF32支持、多实例GPU-MG技术、第三代NVLInk互联技术和结构化稀疏效率技术。此外,TensorCore核心现在支持FP64精度,与HPC应用相关计算力增加2.5倍。在与Volta比较时,以2017年发布为基准,其对BERT模型训练性能提升6倍,对BERT模型推理性能提升7倍。

DGX A100单节点性能达到创纪录5 Petaflops

为了更好地应对复杂多样化增长中的AI算法需求,以及云计算、汽车、零售等众多领域中不断增加的人工智能应用,英伟达推出了第三代AI系统DGX A100。这款系统不仅拥有320GB内存用于训练最大型数据集,还配备200Gbps MeLLanox HDR互连,以及可分割成56个实例进行加速处理的小型工作负载。

总结来说,DGX A100拥有六大技术特点:8个NVIDIA A100 TensorCore GPU, Al 性能达到5PetafLops, GPU 内存共320GB ,每秒12.4TB带宽;6个采用第三代NVIDIA NVLink技术的NVIDIA NVSwitch互联结构,每秒双向4.8TB带宽;9个MeLLanox ConnectX-6 HDR 200Gb/s网络接口,每秒双向3.6TB带宽;15TB Gen4 NVMe 内存,比Gen3 NVMe SSDs 快2倍;以及专为AI和数据科学优化软件,使企业获得更快投资回报。

尽管价格昂贵,但通过一个价值1百万美元由五台DGXA100组成机框,可以取替现有的1100万美元由50台DGX-1及600颗CPU组成25台机箱强大的数据中心,从而显著减少成本与功耗。此举意味着该系统可以实现相同功能但耗电量仅为现有系统的一分之一、二分之一空间、三分之一成本。

标签:

猜你喜欢

人格测评 深圳职业技术学...
深港合作下的技能培养新高地:探索深圳职业技术学院的人才成长路径 在中国改革开放的浪潮中,深圳作为一座国际化大都市,其经济发展模式与其他城市有着本质的不同。...
人力资源测评工具有哪些 智能制造生产线...
在我身边,一个不起眼的角落里,有一条线,它是我的工厂的灵魂,是我日夜守护的智能制造生产线。它不仅仅是一排机器和设备,而是一个集智慧与力量于一体的系统,让每...
中国第三方检测机构排名 智能装备的新篇...
智能装备的新篇章:探索智能技术与工业革命的交汇点 智能装备的定义 在当今这个快速发展的时代,智能装备不仅仅是简单的机器,它们融合了先进的人工智能、物联网和...
ai智能测评 什么因素决定了...
在全球城市化进程中,智能交通系统已成为推动现代城市发展的重要力量。北京作为中国首都和政治、文化中心,其智能交通网建设不仅关系到市民出行便利性,也是对国家形...

强力推荐