阿里含光800 AI处理器高调亮相犹如一位技艺精湛的匠人在芯片制作流程及原理上雕琢出高效之作它在三大
阿里巴巴集团首席技术官兼阿里云智能总裁张建锋在2019年杭州云栖大会上隆重发布了自家的AI芯片含光800,引发科技界巨大关注。近日,在今年的线上云栖大会上,阿里云异构计算产品研发总监龙欣详细介绍了这款AI推理芯片的一年来最新进展。
龙欣表示,含光800 NPU实例已经正式对外服务,无需白名单即可在阿里云实例上购买。该实例支持8核NPU和96核vCPU、384G内存以及最高30Gbit/s网络带宽,主要面向数据中心的CNN类型模型推理加速,应用场景包括城市大脑、图像视频审核和拍立淘等。
值得注意的是,尽管含光800尚未对外发售,其性能已经通过阿里云输出。在具体应用中,该芯片表现出色。例如,在城市大脑中,它可以处理40颗传统GPU所需时间的1/5,而拍立淘则能缩短商品库识别时间至原来的1/20。
含光800以其深度优化CNN及视觉类算法、高效低延时设计,以及针对特定模型如ResNet-50、SSD/DSSD、Faster-RCNN等的优化而闻名。此外,它还具备高密度计算与存储能力,以减少I/O需求,并支持权重稀疏压缩和量化压缩,以及可编程模型扩展功能。
据悉,与主流GPU相比,当涉及到行人检测时,可使用4核含光800支持100路视频;车辆检测中,则可支持85路视频;而在内容识别应用中的ResNet50 V2模型下,可达到20000 FPS帧率,这些都显示出了它显著提升性能的情况。
然而,对于语音交互和自然语言理解等领域的应用示例优势,没有提供具体数据。不过,可以看出,即便是去年的亮相,此次分享仍然没有给予太多关注度,有可能是由于当前全球贸易环境导致公司对于此类话题更加谨慎。此外,大规模落地也需要长期努力,同时软件方面也扮演着关键角色。