深圳的芯片公司前十名中为什么平头哥和英伟达能在MLPerf基准测试中并驾齐驱各自荣获第一

深入探究MLPerf Inference v0.5的初步成绩，雷锋网揭秘芯片公司的强大表现

随着技术的不断进步，机器学习领域正迎来一场革命。为了衡量各种加速器和系统执行训练后的神经网络性能，MLPerf组织推出了其首个官方结果。尽管该基准测试仍然不完整，但它已经吸引了主要芯片公司的关注，并向客户（和投资者）展示了各自硬件在基准测试中的优异表现。

MLPerf Inference v0.5目前仅涵盖5个网络/基准，并且还没有包括功耗测试指标，这是衡量整体能源效率必不可少的一环。不过，第一轮官方基准测试提交了近600份结果，这远超出了预期，全新基准测通常需要一段时间才能建立起来。这说明行业对MLPerf的期待，以及推理芯片数十亿美元市场将继续快速增长。

发布初步成绩后，大多数主要芯片公司都在发布与结果相关的公告，声明或新闻稿。这些公告显示，无论是总吞吐量、延迟，每个加速器的吞吐量等，都有很多空间可以缩小标准范围，以找到成功方案。此外，即使初始版本足够广泛，也能涵盖很多用例，尤其是在专用加速器的情况下，它们通常针对特定用例进行了优化。

除了封闭分区，“苹果对苹果（apples-to-apples）”测试，还有开放分区更为开放。芯片公司被允许重新训练网络以及进行更广泛的量化工作。在封闭分区，他们必须达到数学上的等效性，而在开放分区，则更加自由以展现解决方案和团队独创性。

从CPU到FPGA、DSP和专用ASIC等各领域，有来自不同类型处理器的大型提交成果。包括NVIDIA GPU、谷歌TPU、英特尔CPU和加速器，以及Habana Labs Goya加速器等。但缺少功耗测试意味着目前无法测量能效，只能看到每个类别中取得胜利的情况，如Google TPUv3拓展性的完美演示，或NVIDIA Tesla加速器在某些测试中的领先地位。

虽然这些早期版本还未完成，但对于芯片公司来说，他们现在知道自己所处位置，并且还有大量空间来优化其系统以准备未来正式测试及设计新硬件。而客户希望他们能够加快工作进展，因此第一个结果已经出炉，现在就是它们集中精力产品并了解如何做好准备时刻。