深圳的芯片公司前十名中为什么平头哥和英伟达能在MLPerf基准测试中并驾齐驱各自荣获第一
深入探究MLPerf Inference v0.5的初步成绩,雷锋网揭秘芯片公司的强大表现
随着技术的不断进步,机器学习领域正迎来一场革命。为了衡量各种加速器和系统执行训练后的神经网络性能,MLPerf组织推出了其首个官方结果。尽管该基准测试仍然不完整,但它已经吸引了主要芯片公司的关注,并向客户(和投资者)展示了各自硬件在基准测试中的优异表现。
MLPerf Inference v0.5目前仅涵盖5个网络/基准,并且还没有包括功耗测试指标,这是衡量整体能源效率必不可少的一环。不过,第一轮官方基准测试提交了近600份结果,这远超出了预期,全新基准测通常需要一段时间才能建立起来。这说明行业对MLPerf的期待,以及推理芯片数十亿美元市场将继续快速增长。
发布初步成绩后,大多数主要芯片公司都在发布与结果相关的公告,声明或新闻稿。这些公告显示,无论是总吞吐量、延迟,每个加速器的吞吐量等,都有很多空间可以缩小标准范围,以找到成功方案。此外,即使初始版本足够广泛,也能涵盖很多用例,尤其是在专用加速器的情况下,它们通常针对特定用例进行了优化。
除了封闭分区,“苹果对苹果(apples-to-apples)”测试,还有开放分区更为开放。芯片公司被允许重新训练网络以及进行更广泛的量化工作。在封闭分区,他们必须达到数学上的等效性,而在开放分区,则更加自由以展现解决方案和团队独创性。
从CPU到FPGA、DSP和专用ASIC等各领域,有来自不同类型处理器的大型提交成果。包括NVIDIA GPU、谷歌TPU、英特尔CPU和加速器,以及Habana Labs Goya加速器等。但缺少功耗测试意味着目前无法测量能效,只能看到每个类别中取得胜利的情况,如Google TPUv3拓展性的完美演示,或NVIDIA Tesla加速器在某些测试中的领先地位。
虽然这些早期版本还未完成,但对于芯片公司来说,他们现在知道自己所处位置,并且还有大量空间来优化其系统以准备未来正式测试及设计新硬件。而客户希望他们能够加快工作进展,因此第一个结果已经出炉,现在就是它们集中精力产品并了解如何做好准备时刻。
随着时间推移,MLPerf Inference基准将趋于成熟,最终成为稳定可靠并易于使用的一个工具。如果运气好,我们不久后就能够把这个评估应用到我们自己的设备上,以比较消费级硬件。这是一个令人激动人心的时候!