TPU v4强势登场性能如同雄鹰般俯冲超算之冠
Google I/O开发者大会在疫情的影响下改为线上形式举行,Google CEO桑达尔·皮查伊宣布推出多项新技术,包括全息视频聊天技术Project Starling和最新一代AI芯片TPU v4。
TPU v4性能提升显著
TPU v4相较于前一代TPU v3,在相同的64芯片规模下性能平均提升2.7倍。每个TPU v4 Pod中有4096个单芯片,由于其独特互连技术,可以将数百独立处理器转变为一个系统,其互连带宽在规模上是其他任何网络技术的10倍,每一个Pod可以达到1 exaFlOP级算力,这甚至是全球最快超级计算机“富岳”的两倍性能。
今年MLPerf结果显示,256个TPU v4完成ImageNet数据集图像分类训练测试(准确度至少75.90%)需要1.82分钟,与768张Nvidia A100图形卡、192个AMD Epyc 7742内核、512块华为AI优化的Ascend910芯片以及128个Intel Xeon Platinum 8168内核组合起来速度相当快。在BERT模型训练上,使用256个TPU v4需要1.82分钟,比使用4096 TPU V3短0.39分钟,而与2048张A100卡和512个AMD Epyc 7742 CPU内核相比要慢0.81分钟。
展示实例
Google同样在I/O大会上展示了能够用到TPU V4的具体AI实例,如MUM模型(Multitask Unified Model),适合赋能搜索引擎帮助用户高效地得到信息,以及专为对话打造的LaMDA,可以与人类进行不间断对话交流。这些场景模型都能够利用到这款强大的AI加速器。
自研五年更新四代
Google自2016年宣布首款内部定制AI芯片以来,一直保持着一年一次迭代更新节奏。这次发布的是第五代产品,即以其先进性著称的第四代产品——谷歌Tpu V4。
本文参考连接:
https://venturebeat.com/2021/05/18/google-details-new-ai-accelerator-chips/
https://www.datacenterknowledge.com/machine-learning/google-more-doubles-its-ai-chip-performance-tpu-v4
雷锋网雷锋网雷锋网