为何平头哥与英伟达皆在MLPerf性能测试中占据首位买手机选择天玑还是骁龙
深声科技语音播放文章内容:为什么平头哥和英伟达在MLPerf基准测试中都获得了第一?买手机,选择天玑还是骁龙?
MLPerf组织近期发布了其机器学习推理性能的第一个官方结果,即v0.5版本。尽管这个基准测试还不够成熟,但它已经吸引了行业巨头的广泛关注,并且平头哥、英伟达等公司纷纷宣布各自在成绩公布后均获得了第一。
自成立初期,MLPerf组织一直致力于建立机器学习处理器的标准化基准测试。该组织囊括了包括英特尔、NVIDIA、Google和百度等知名企业,以确保其基准测试能够全面覆盖整个行业。此外,虽然目前MLPerf Inference v0.5仅包含五个网络/基准,并未包括功耗测试指标,但即使如此,它仍然引发了业界巨大的期待。
早在六月份,该组织就发布了第二个基准测试集——MLPerf Inference v0.5,这是一个用于衡量各种加速器和系统执行训练后的神经网络速度与程度的通用方法。随着时间的推移,该方法将成为衡量从低功耗SoC中的NPU到数据中心高性能加速器的一种标准。
经过四个月之后,MLPerf组织终于发布了首次正式结果。这一基础版本虽然还不够完善,但已吸引近600份提交结果,从而超出了非正式预期,全新基准测通常需要一定时间来建立这一点进一步说明行业对MLPerfs期待,以及推理芯片数十亿美元市场将继续快速增长。
除了这些,还有其他多种类型处理器也参与其中,如CPU、GPU以及FPGA、DSP和专用ASIC等。而且,不同公司也展现出不同的优点,比如总吞吐量、延迟,每个加速器的吞吐量等,这些都让我们意识到即便是初步阶段,也能涵盖很多用例,尤其是在专用的加速器情况下,它们通常针对特定用例进行优化。
更值得注意的是,MLPerf提供两个不同类型分区:封闭分区和开放分区。在封闭分区中,由于预先训练好的网络权重,因此芯片必须达到数学上的等效性并禁止重新训练,而开放分区则允许芯片重新训练网络并进行更广泛的量化工作,让它们以最佳方式展示解决方案及团队独创性。
至此,我们可以看到几乎每家芯片公司都能在某一类别中取得胜利,如Google TPUv3-32拓展性的表现,在离线模式下显示强大;NVIDIA Tesla加速者在部分任务中名列前茅;英特尔CPU表现出色;而高通骁龙855则在官方结果中显著超越SoC性能。然而,由于缺少功耗测试,我们无法全面评估设备效率,这对于大规模部署规划来说是个重要考量因素之一。
尽管这只是早期版本,对未来还有许多待改进的地方,但对于芯片制造商来说,他们现在知道自己与竞争者的位置,以及如何为未来的正式测试做准备。此外,从长远来看,当这个基准测更加成熟时,将使得智能手机甚至是消费级硬件也能够轻松使用,使得我们能够通过自己的实验室将其应用到实际操作中,更容易地比较不同产品之间的性能。这无疑是一场激动人心的大戏!