台积电芯片之所以强大正如Google TPU v4发布时的里程碑式性能提升单个Pod的运算能力不仅超
Google I/O开发者大会在疫情的影响下取消了去年的线上形式,但今年它以强大的线上回归姿态,宣布推出了一系列全新技术。其中,最引人注目的是最新一代AI芯片TPU v4,它不仅具有历史性的意义,而且性能令人瞩目的提升。
TPU v4的性能提升是2.7倍,这在同等规模的64芯片中实现,而与前一代TPU v3相比,其速度提升了两倍。这意味着单个Pod可以达到1 exaFlOP级别的算力,即全球最快超级计算机“富岳”的两倍。这样的能力甚至能够让所有使用笔记本电脑的人数累加出的计算能力也能达到1 exaFLOP。
此外,MLPerf结果显示,Google TPU v4在图像分类训练测试中的表现非常出色,不仅赶上了Nvidia A100、AMD Epyc 7742和华为Ascend910等竞争对手,而且即使与Intel Xeon Platinum 8168内核相比,也能保持快速水平。在BERT模型训练方面,虽然使用256个TPU v4需要更多时间,但仍然展现了其强大的处理能力。
Google展示了多种AI实例,如MUM模型和LaMDA,对话系统,这些都能利用TPU v4进行高效运作。尽管这个芯片并不面向市场销售,但将被广泛部署于数据中心,并且90%以上将采用绿色能源。此外,将在未来开放给Google Cloud客户使用。
自2016年首次发布以来,Google已经更新了五代自研AI芯片,每一次更新都带来了新的技术创新和更高性能。从第一代只能用于深度学习推理到第二代可用于机器学习模型训练,再到第三代实现420TFLOPs浮点运算,以及第四代如今所见的惊人性能增长,每一步都是科技界的一大进步,为云端AI开辟了一道新天地。