TPU v4芯片科技之舟在海洋中航行单桅船性能超越蓝色巨人
Google I/O开发者大会在疫情的阴影下重燃希望,线上形式中,公司CEO桑达尔·皮查伊宣布了一系列创新技术,其中包括全息视频聊天技术Project Starling和最新一代AI芯片TPU v4。
TPU v4:新一代AI加速器,性能提升两倍
这款芯片被描述为“历史性的里程碑”,能够实现比前代TPU v3更快的速度。官方数据显示,在相同规模64芯片的情况下,不考虑软件优化,TPU v4的性能平均提升了2.7倍。
每个Pod都包含4096颗单独的TPU v4芯片,这些芯片通过独特互连技术形成一个系统,其带宽在规模上超过其他任何网络技术。这样的设计使得每个Pod达到1 exaFlOP级别算力,即全球最快超级计算机“富岳”性能的一半以上。
如果有100万台笔记本同时使用其计算能力,他们累积起来刚好达到1 exaFLOP,而之前要达成这一点可能需要定制一个超级计算机。这表明了Google TPU v4在处理大型数据集时的强大实力。
MLPerf测试结果进一步证明了其强劲表现。在图像分类任务上,它与768块Nvidia A100、192块AMD Epyc 7742内核以及512块华为Ascend910卡等硬件组合速度相当。此外,对于BERT模型训练,也能与2048张A100卡和512个Epyc 7742 CPU内核相匹配。
Google展示了多种应用场景,如MUM(Multitask Unified Model)和LaMDA(Large Language Model Dialog Application),这些模型可以同时处理网页、图像等多种数据,并且能够进行高效对话交流。90%左右的TPU V4将使用绿色能源,并计划今年晚些时候向Google Cloud客户开放。
自2016年推出第一代自研AI芯片以来,Google已经发布了五代产品,每次更新都带来了显著改进,从28nm工艺到420TFLOPs浮点运算能力,再到现在拥有如此强大的性能。这不仅打破GPU在深度学习领域的地位,还打开了云端AI竞争格局。未来的世界看起来如何?Google TPU给出了我们一些答案。