阿里含光800 AI处理器高调亮相犹如半导体芯片龙头股的雄鹰在四处展翅实现了在三大关键场景下的落地性
阿里巴巴集团首席技术官兼阿里云智能总裁张建锋在2019年杭州云栖大会上隆重发布了自家的AI芯片含光800,引发科技界巨大关注。近日,在今年的线上云栖大会上,阿里云异构计算产品研发总监龙欣详细介绍了这款AI推理芯片的一年来最新进展。
龙欣表示,含光800 NPU实例已经正式对外服务,无需白名单即可在阿里云实例上购买。该实例支持8核NPU和96核vCPU、384G内存以及最高30Gbit/s网络带宽,主要面向数据中心的CNN类型模型推理加速,应用场景包括城市大脑、图像视频审核和拍立淘等。
值得注意的是,尽管含光800尚未对外发售,其性能已经通过阿里云输出。在具体应用中,该芯片表现出色。例如,在城市大脑中,它可以实现40颗传统GPU所需时间的四分之一,而拍立淘则能缩短商品库每天新增10亿图片识别时间从1小时至5分钟。
包含深度优化CNN及视觉类算法、高能效与低延时、高密度计算与存储以及软硬协同支持权重稀疏压缩等特点,这款AI芯片针对ResNet-50、SSD/DSSD、Faster-RCNN、Mask-RCNN和DeepLab等模型进行了优化。
据介绍,不仅如此,还有其他三种场景展示了其性能优势:行人检测应用中4核含光800支持100路视频,比主流GPU多4倍;车辆检测中也以85路视频为标桩,比主流GPU高8.5倍;而在ResNet50 V2模型中的内容识别应用中,可达20000 FPS,比主流推理GPU提升11倍;Inception V4模型处理帧率达到5000 FPS,比主流推理GPU提升10.8倍。此外,对于直播视频增强亦有显著提升,以至于点播HDR可实现6.6倍性能加速比。
虽然目前对于语音交互及自然语言理解领域的实际应用数据没有公开,但这些数据显示出了含光800在不同场景下的卓越表现,并且其优势相较于传统GPU显著增长,从而证明了其作为一种新型AI处理器的地位。