手机芯片处理器排行榜新一代Google TPU v4发布性能如同超级马里奥跃过管道一般让其他竞争者望
Google I/O开发者大会今年在疫情的阴影下举行,通过线上形式展现了公司最新的技术成果。Google CEO桑达尔·皮查伊宣布推出多项全新技术,其中包括能够实现“空间瞬移”的全息视频聊天技术Project Starling,以及最新一代AI芯片TPU v4。
TPU v4性能提升2倍,处理速度翻番
Google官方介绍,在相同的64芯片规模下,不考虑软件带来的改善,TPU v4相较于上一代TPU v3性能平均提升2.7倍。在实际应用中,TPU v4主要与Pod相连发挥作用,每一个TPU v4 Pod中有4096个TPU v4单芯片,这些芯片得益于其独特的互连技术,可以将数百个独立的处理器转变为一个系统,其互连带宽在规模上是其他任何网络技术的10倍,每一个Pod都能达到1 exaFlOP级别算力,即每秒10^18次浮点运算。这甚至是全球最快超级计算机“富岳”的两倍性能。
如果现在有100万人同时使用笔记本电脑,将所有这些计算机累加起来所产生的计算能力,就刚好达到1 exaFLOP水平。而之前要达到这个水平,要么需要专门定制一个超级计算机,要么等待更先进的人工智能硬件出现。今年MLPerf结果显示,Google TPU V4在图像分类训练测试(准确度至少75.90%)上的表现令人瞩目,它几乎与768张Nvidia A100图形卡、192张AMD Epyc 7742内核组合在一起完成同样的任务。
此外,当负责大型维基百科语料库上的BERT模型训练时,使用256个TVP V进行训练比使用4096 TPU V3慢近1分钟,而要想用Nvidia A100和AMD Epyc 7742 CPU内核来实现0.81分钟所需时间则需要2048张A100卡和512个Epyc 7742 CPU内核。这样的强劲性能使得它成为一种理想的人工智能加速器。
除了提供高效率的人工智能解决方案之外,这款不向公众销售但部署到数据中心中的TVP还特别注重环保,因为90%左右会采用绿色能源。此外,据悉,这款芯片将会开放给更多客户,使得他们也能利用这一强大的工具来提高自己的工作效率和产品质量。