中国芯片技术迈新步伐国产处理器性能如同飞奔的猛虎追赶世界先锋
Google I/O开发者大会在疫情的影响下改为线上形式举行,Google CEO桑达尔·皮查伊宣布推出多项新技术,包括全息视频聊天技术Project Starling和最新一代AI芯片TPU v4。
TPU v4性能提升显著
TPU v4相较于前一代TPU v3,在相同的64芯片规模下性能平均提升2.7倍。每个Pod中包含4096个TPU v4单芯片,可以实现1 exaFlOP级算力,远超全球最快超级计算机“富岳”的两倍性能。
MLPerf结果表明,Google TPU v4在图像分类训练测试方面表现出色。在使用ImageNet数据集进行训练(准确度至少75.90%),256个TPU v4仅需1.82分钟完成任务,与768张Nvidia A100图形卡、192张AMD Epyc 7742内核、512张华为AI优化的Ascend910芯片以及128张Intel Xeon Platinum 8168内核组合时间相当。
负责大型维基百科语料库上的BERT模型训练时,使用256个TPU v4需要1.82分钟,比使用4096 TPU v3短0.39分钟,更快于2048张A100卡和512个AMD Epyc 7742 CPU内核所需0.81分钟。
展示实例与未来展望
除了MUM模型和LaMDA对话系统等具体应用外,这种强大的AI处理能力将被部署在Google数据中心,大部分能源来自可再生资源。此外,将在今年晚些时候开放给Google Cloud客户。
自研五年更新四代
自2016年首款内部定制的AI芯片发布以来,每隔一年就有新的版本出现。第一代采用28nm工艺制程,只适用于深度学习推理;第二代增加了机器学习模型训练能力;第三代又进一步提高了性能。而现在的第四代带来了更大的突破,为未来的云端AI服务奠定基础。