全球十大汽车芯片之冠阿里含光800 AI处理器闪耀登场如同猛虎般跃入舞台其在三大应用场景中的表现力不
在2019年的云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋隆重发布了公司的首款AI芯片——含光800,这款当时最强大的AI推理芯片的问世,让整个行业震惊不已。今年,在一次线上论坛中,阿里云异构计算产品研发总监龙欣分享了自发布以来含光800近一年来的最新进展。
他表示,含光800 NPU实例已经正式对外提供服务,无需白名单即可购买,并且支持数据中心中的CNN类型模型推理加速,主要应用于城市大脑、图像视频审核和拍立淘等领域。尽管这款芯片尚未在公开市场上销售,但其性能已经通过阿里云输出。
龙欣提到,随着内部广泛的AI应用需求,如电商、视觉、语音交互和自然语言理解等方面的发展,阿里巴巴希望通过自研芯片提升效率和性价比。例如,在拍立淘这个功能中,每天有两千多万用户使用该功能进行商品搜索与推荐,这些都需要极高的AI能力。
包含以下几个特色:
深度优化CNN及视觉类算法
加速卷积和矩阵乘法
针对特定模型如ResNet-50、SSD/DSSD等进行优化
高能效低延时、高密度计算与存储减少I/O需求
软硬协同支持权重稀疏压缩及量化压缩
去年,当张建锋介绍含光800时,他声称它在业界标准下的ResNet-50测试性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍,其能效比达到了500 IPS/W,是第二名的3.3倍。但是,此次龙欣并没有提及具体峰值性能,而是强调其可用性,并表示“通过阿里云输出”。
为了让用户能够开箱即用,便于安装NPU驱动和SDK,同时系统支持公共镜像CentOS 7.6/7.7以及Ubuntu 16.04,还预装主流深度学习框架如TensorFlow、MXNet,并提供示范教程。在实际应用中相比GPU,有4-11倍性能提升。
据提供的情报显示,在三大场景中:城市大脑视频处理时间从300ms降至150ms;拍立淘商品库识别时间由1小时缩短至5分钟;行人检测增加了100路视频,与主流GPU相比提升了4倍;车辆检测增加85路视频,与主流GPU相比提升8.5倍;而在内容识别应用中的ResNet50 V2模型帧率提高到20000 FPS,比主流推理GPU快11倍。在点播HDR中,可实现6.6倍性能加速比。
尽管此次分享给出的数据并不全面,但可以看出,即便是在当前复杂国际贸易环境下,对于新一代AI技术仍然充满期待。而对于未来是否会有新的重大突破,以及何时能够见到下一代AI芯片,我们只能继续关注雷锋网更新的情况。