中国芯片最强是谁Google TPU v4发布性能如同天鹅一跃超越世界之巅
Google I/O开发者大会在疫情的阴影下重燃希望,线上形式的回归标志着科技巨头对未来创新战略的一次重大布局。在没有开发者亲临场地的情况下,Google CEO桑达尔·皮查伊宣布了一系列革新技术,其中包括全息视频聊天技术Project Starling和最新一代AI芯片TPU v4。
这次TPU v4的发布被认为是一个历史性的里程碑。它不仅比前一代TPU v3性能提升了2.7倍,而且能够实现单个Pod性能超过全球最快超算“富岳”的两倍。这意味着,如果将1千万台笔记本电脑累加计算能力,其总体算力也只能达到1 exaFLOP,而TPU v4 Pod却能轻松达到这一水平。
此外,根据MLPerf结果显示,即使是在图像分类训练测试方面,256个TPU v4也能够在1.82分钟内完成任务,这与768块Nvidia A100图形卡、192块AMD Epyc 7742内核或512块华为AI优化的Ascend910芯片组合在一起所需时间相当。而在BERT模型训练方面,使用256个TPU v4则需要1.82分钟,比使用4096 TPU v3短15分钟,但仍未能匹敌2048张A100卡和512个AMD Epyc 7742 CPU内核所需0.81分钟。
这些强大的AI实例,如MUM模型(Multitask Unified Model)和LaMDA,都可以利用到这个新一代芯片。MUM模型相比于BERT强大1000倍,是适用于搜索引擎以帮助用户更高效获取信息;而LaMDA则可以进行持续不断的人机对话交流。
自2016年首次推出自研AI芯片以来,Google已经更新至第四代。在五年的发展历程中,无论是从片上内存还是可编程能力来看,它们一直都是行业中的佼佼者,不断打破GPU的地位,并开启了云端AI芯片市场新的竞争格局。未来的世界可能是什么样子?Google TPU已经向我们展示了一小部分答案。