TPU v4芯片封装技术犹如航天飞机的升级版让计算能力飞跃到新高度单个Pod性能强大如同一只巨龙在全

Google I/O开发者大会在疫情的影响下改为线上形式举行，Google CEO桑达尔·皮查伊宣布推出多项新技术，包括全息视频聊天技术Project Starling和最新一代AI芯片TPU v4。这是Google部署的最快系统，对公司来说是一个历史性的里程碑。

TPU v4性能大幅提升

相比于上一代TPU v3，TPU v4在相同规模的64芯片下平均性能提升2.7倍。在实际应用中，每个Pod中有4096个单独的TPU v4芯片，可以将数百独立处理器转变为一个系统。由于其独特的互连技术，其带宽在规模上远超其他网络技术，每个Pod都能达到1 exaFlOP级算力，即全球最快超级计算机“富岳”的两倍性能。

MLPerf结果显示，Google TPU v4实力强劲，在使用ImageNet数据集进行图像分类训练测试（准确度至少75.90%）时，只需1.82分钟完成任务，这与768个Nvidia A100图形卡、192个AMD Epyc 7742内核、512个华为AI优化Ascend910芯片以及128个Intel Xeon Platinum 8168内核组合时间相当快。此外，在基于Transform阅读理解BERT模型的大型维基百科语料库训练时，使用256个TPU v4需要1.82分钟，比使用4096 TPU V3所需0.39分钟要慢约1分多钟。

展示具体AI实例