阿里含光800 AI处理器芯片排名前十亮相高调展现在人物场景下的超越GPU性能达4-11倍提升
在2021年的阿里云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋简短地介绍了他们的首款AI芯片——含光800,这款当时最强的AI推理芯片的发布引发了巨大的关注。今年,阿里的线上云栖大会中,有一个关于芯片设计发展现状与未来的论坛,在这个论坛上,阿里云异构计算产品研发总监龙欣分享了含光800推出近一年后的最新进展。
龙欣表示:“含光800 NPU实例已经正式对外服务,不需要白名单就可以在阿里云实例上购买,实例名称是ebman1.24xlarge,最多支持8核NPU和96核vCPU,384G内存,网络带宽最高达到30Gbit/s。”他还提到,这款芯片主要面向数据中心的CNN类型模型推理加速,其业务包括城市大脑、图像视频审核、拍立淘等。
更值得注意的是,对于含光800在具体应用中的表现。尽管这款芯片尚未对外发售,但其性能通过阿里云输出。这意味着用户可以自动安装NPU驱动和SDK,并且系统方面支持公共镜像CentOS 7.6/7.7和Ubuntu 16.04,还预装主流深度学习框架,如TensorFlow和MXNet。
龙欣强调,由于含光800作为并没有在公开市场发售的芯片,所以它通过Arichannel输出。目前,在具体应用中相比GPU有4-11倍性能提升。在城市大脑中实时处理杭州主城区交通视频,比传统GPU快40倍;拍立淘商品库每天新增10亿商品图片,比传统GPU快5分钟;行人检测应用中,比主流GPU多4倍;车辆检测中,比主流GPU多8.5倍;ResNet50 V2模型中的帧率比主流推理GPU高11倍;Inception V4模型中的帧率比主流推理GPU高10.8倍。此外,在直播、点播、短视频等内容识别应用中,也显示出了显著优势。
此次会议上的分享虽然提供了一些新的信息,但对于新一代AI芯片可能会是什么时候发布的问题,没有给出明确答案。不过,从过去几年来看,大型科技公司自研芯片项目通常需要很长时间才能从概念阶段到实际部署,因此,我们可以期待未来有更多更新。