平头哥与英伟达如何在MLPerf基准测试中并驾齐驱芯片的模样岂是人间之物
深声科技语音播放文章内容,由于您的浏览器不支持audio元素,您无法聆听。
雷锋网报道,MLPerf组织近日公布了第一个MLPerf Inference v0.5的结果,这一基准测试虽然尚处初级阶段,但已吸引了业界巨头的广泛关注。平头哥和英伟达在成绩发布后分别宣布,他们各自在该测试中都获得了第一名。
自成立以来,MLPerf组织一直致力于建立机器学习领域的标准化基准测试,以便与CPU类似的方式评估处理器性能。该组织成功地聚集了包括英特尔、NVIDIA、谷歌和百度在内的行业主要玩家,共同推动这一过程。
6月份,MLPerf就已经发布了第二个基准测试集——MLPerf Inference v0.5。这项测试旨在衡量各种加速器和系统执行训练后的神经网络速度与程度,并且将成为评估从低功耗SoC中的NPU到数据中心高性能加速器性能的一种通用方法。在四个多月之后,MLPerf终于公布了首个官方结果。
尽管这次基准测验仍然比较简陋,只覆盖五个网络/基准,并未包含功耗测试指标,但它依然吸引了一众芯片公司参与,使得第一轮提交结果达到近600份,比预期要多得多,这也反映出业界对MLPerf的期待,以及推理芯片市场数十亿美元潜力的快速增长。
随着正式结果公布,大部分主流芯片公司纷纷发表声明或新闻稿,以此来展示自己成绩。这些提交分布在40种不同的测试中,每家公司都能找到适合自己的成功方案,无论是总吞吐量、延迟还是每个加速器的吞吐量等。
值得注意的是,该套件分为五个基准,其中两个是其主基准移动衍生产品。而当前桌面/服务器版本涵盖图像分类(ResNet50)、对象检测(ResNet34)以及机器翻译任务(GNMT)。所有这些提供单路、多路、服务器及离线四种方案,每种方案又进一步分解为终端和服务器两大平台类型。此外,还有封闭分区和开放分区两种模式,其中封闭分区要求保持数学上的等效性,而开放分区则允许更广泛的优化空间以展示独创性解决方案。
最终收到的成果来自CPU至FPGA等各领域,从NVIDIA GPU到Google TPU,再到Intel CPU及Habana Labs Goya加速器,有些甚至是预期之外,如Raspberry Pi 4及阿里巴巴含光800加速者。几乎每家芯片公司都能在某些方面取得胜利,如Google TPUv3拓展性的完美表现,或是Tesla 加速者的显著成绩,以及Intel CPU及高通骁龙855 SoC 在相应领域强势表现。
需要说明的是,此次报告并非最终成绩,因为还需进行更多完善以添加其他网络类型,如语音识别任务,同时也会加入功耗测试,以确保每个人都可以看到他们设计效率,即电源效率通常被视作大规模部署规划中的关键因素之一。此外,这一早期版本对于添加优化仍有余地,为未来硬件设计开辟更多可能性,同时客户希望见证更快发展进展,因此现在已知如何准备下一轮正式比拼。而长远看,随着时间推移,该基础设施将变得更加成熟,便于使用,不仅限于实验室,也可应用于消费型设备上,对比不同硬件配置时产生意义重大的效果。一段令人激动的人生旅程即将开始!