阿里含光800 AI处理器如同雄鹰般高飞亮相后在三大场景中展现出的性能如同一位技艺超群的匠人用其卓越

在2019年的云栖大会上，阿里巴巴集团首席技术官兼阿里云智能总裁张建锋向公众展示了他们的第一款AI芯片——含光800，这一亮相立即引起了巨大的关注。今年，在阿里的线上云栖活动中，异构计算产品研发总监龙欣继续分享了含光800近一年来的最新进展。

龙欣表示，含光800 NPU实例已经正式对外服务，不需要任何白名单限制，就可以在阿里云实例上购买。这种强大的AI处理器最多支持8核NPU和96核vCPU、384G内存以及30Gbit/s网络带宽。它主要面向数据中心的CNN类型模型推理加速，应用于城市大脑、图像视频审核以及拍立淘等业务。

更令人振奋的是，其在实际应用中的表现。尽管还未对外发布，但通过阿里云输出的性能数据显示其卓越之处。在电商应用、视觉应用、语音交互、自然语言理解和机器翻译等广泛领域中，含光800都扮演着重要角色，比如拍立淘，它利用强大的AI能力来帮助用户快速搜索商品并进行个性化推荐。

至于硬件方面，含光800深度优化CNN及视觉类算法，加速卷积和矩阵乘，以及针对特定模型（如ResNet-50）的优化，让其成为提升效率与性价比的完美工具。此外，还有高能效低延时、高密度计算与存储，以及软硬协同支持权重稀疏压缩和量化压缩功能，使得它能够适应各种复杂场景。

据介绍，由于没有公开市场销售，此芯片是通过阿里云输出。在使用过程中，可以自动安装NPU驱动和SDK，并提供TensorFlow和MXNet示范教程。这使得开发者能够轻松地集成到现有的系统中，以实现高性能加速。而且，在三大场景下，即城市大脑、大型端设备及其他DNN模型推理加速，可获得4-11倍GPU性能提升。

具体而言，在行人检测应用中，它可支持100路视频，对比主流GPU25路；车辆检测则可达到85路视频，对比主流GPU10路；而在直播内容识别中的ResNet50 V2模型，其帧率为20000 FPS，与主流推理GPU1800 FPS相比性能提升达到了11倍；Inception V4模型，则为5000 FPS，与460FPS相比性能加速比例达到10.8倍。此外，还有直播视频增强及点播HDR等多种场景，都展现出了显著的优势。

虽然此次分享给出的数据并不全面，而且涉及到的细节也较少，但我们仍然可以看出，即便是在软件层面所需时间长久且挑战重重，只要有足够的人才投入，就有可能创造出革命性的变化。因此，我们对于未来可能出现的一代又一代更先进的AI芯片感到充满期待，并相信它们将会继续推动技术前沿迈出坚实一步。