中国芯片公司阿里含光800 AI处理器高调亮相应用于人物识别场景其落地性能在该场景中比GPU高出4-

在2019年的杭州云栖大会上，阿里巴巴集团首席技术官兼阿里云智能总裁张建锋简短介绍了阿里的首款AI芯片含光800。这款当时最强的AI推理芯片的发布引发了巨大关注，可谓高调亮相。

今年的线上云栖有一个芯片设计发展现状与未来的论坛，阿里云异构计算产品研发总监龙欣分享了含光800推出近一年后的最新进展。他表示：“含光800 NPU实例已经正式对外服务，不需要白名单就可以在阿里云实例上购买，实例名称是ebman1.24xlarge，最多支持8核NPU和96核vCPU，384G内存，网络带宽最高达到30Gbit/s，主要面向数据中心的CNN类型模型推理加速，业务包括城市大脑、图像视频审核、拍立淘等。”

更引人关注的是含光800在具体应用中的表现。龙欣强调，该芯片作为并没有在公开市场发售的芯片，但通过阿里云输出，以便让用户能够开箱即用。为了让用户自动安装NPU驱动和SDK，他指出系统方面支持公共镜像CentOS 7.6/7.7和Ubuntu 16.04，还预装主流深度学习框架，如TensorFlow、MXNet，并提供示范教程。

他还提到，在行人检测应用中，4核含光800能支持100路视频，比主流GPU25路性能提升4倍。在车辆检测中，可以支持85路视频，比主流GPU10路性能提升8.5倍。而且，在直播、短视频、商品信息流等内容识别应用中的ResNet50 V2模型中，由于其处理能力可达20000 FPS，比主流推理GPU1800 FPS性能提升11倍；而Inception V4模型则可达5000 FPS，对比主流GPU460FPS性能加速比高10.8倍。此外，在直播视频增强中，其性能为500 FPS，而点播HDR则达到66 FPS，与英伟达A100相比实现6.6倍的性能加速比。

尽管如此，这次会议对含光800的关注度并不如去年那么高，而且介绍也较为简单。可能是由于目前紧张的贸易关系，让企业对于相关话题更加谨慎。但我们应该看到，即便有强大的团队能够快速设计出一款芯片，大规模落地仍然需要很长时间，这个过程软件发挥着更加直接作用，以及获得客户认可采用也不容易。