中国芯片十大龙头企业中的阿里含光800像一位高超的技艺家子以其800 AI处理器的高调亮相让三大场景

在2019年的云栖大会上，阿里巴巴集团首席技术官兼阿里云智能总裁张建锋向公众展示了他们的第一款AI芯片——含光800，这一亮相立即引起了业界的广泛关注。今年，在阿里线上云栖举办的芯片设计发展现状与未来的论坛中，阿里云异构计算产品研发总监龙欣详细介绍了含光800推出近一年后的最新进展。

他表示，含光800 NPU实例已经正式对外服务，不需要白名单就可以在阿里云实例上购买。这些实例支持8核NPU和96核vCPU、384G内存，以及网络带宽最高达到30Gbit/s，主要面向数据中心的CNN类型模型推理加速，包括城市大脑、图像视频审核和拍立淘等应用。

更值得注意的是，在实际应用中的表现。在雷锋网之前的一篇文章中提到，科技巨头自研芯片是因为有大量数据在内部AI需求推动下，他们希望通过自研芯片来提升效率和性价比。龙欣也强调了这一点，他指出阿里的内部有广阔的AI应用场景，如电商应用、视觉应用、语音交互、自然语言理解以及机器翻译等，其中拍立淘就是一个典型案例，它需要处理大量图片以进行个性化推荐，这种任务需要强大的AI能力。

为了提高硬件到软件方案的整体性能，比喻地说，就像是锤子砸石头，最终能将山河变成平地。含光800在硬件方面具有深度优化CNN及视觉类算法、高能效低延时、高密度计算与存储，以及软硬协同支持权重稀疏压缩等特点。而且它不仅针对CNN算法模型进行设计，也保持一定灵活性，以匹配全栈软件支持实现高性价比。

去年发布时张建锋声称，在业界标准ResNet-50测试中，其推理性能达到78563 IPS，比目前业界最好的AI芯片性能高4倍；能效比500 IPS/W，是第二名的3.3倍。但是在昨天分享中并没有提及峰值性能，而是强调其可用性。他表示：“尽管还没有公开市场发售，但通过Arailun输出。”

为了让用户能够开箱即用，Arailun提供自动安装NPU驱动和SDK，并预装主流深度学习框架，还提供TensorFlow和MXNet示范教程。

据悉，在三大场景中，即城市大脑、大型端上的行人检测以及车辆检测领域，与GPU相比，其性能提升为4-11倍。在行人检测领域，它可以支撑100路视频，比主流GPU多25路；而车辆检测则可以支撑85路视频，比主流GPU多75路。此外，对于直播内容识别Inception V4模型，其帧率可达5000 FPS，而对于HDR点播，则达到66 FPS，与主流GPU相比分别提升11倍及10倍之多。