阿里含光800 AI处理器亮相后在人物识别场景中表现出色性能高达GPU的4-11倍
在2019年的杭州云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋简短介绍了阿里的首款AI芯片——含光800,这款当时最强的AI推理芯片的发布引发了巨大关注。今年的线上云栖大会中,有一个芯片设计发展现状与未来的论坛,阿里云异构计算产品研发总监龙欣分享了含光800推出近一年后的最新进展。
他表示:“含光800 NPU实例已经正式对外服务,不需要白名单就可以在阿里云实例上购买,实例名称是ebman1.24xlarge,最多支持8核NPU和96核vCPU,384G内存,网络带宽最高达到30Gbit/s,主要面向数据中心的CNN类型模型推理加速,业务包括城市大脑,大规模图像视频审核、拍立淘等。”更值得关注的是含光800在具体应用中的表现。
虽然性能通过阿里云输出,但已有数据显示它相比GPU具有4-11倍高的处理速度。在城市大脑中,它能以150ms延迟完成传统GPU300ms所需40颗卡才能达到的任务。而在拍立淘商品库,每天新增10亿商品图片识别任务,从传统GPU1小时缩减至5分钟。
此外,在行人检测应用中,它支持100路视频,比主流GPU25路性能提升4倍;车辆检测同样可支持85路视频,比主流GPU10路性能提升8.5倍。对于ResNet50 V2模型,其帧率可达20000 FPS,比主流推理GPU1800 FPS性能提升11倍。在Inception V4模型中,其处理帧率为5000 FPS,比主流推理GPU460FPS性能加速比高10.8倍。此外,在直播、点播、短视频等视频质量增强方面,其直播视频增强能力为500 FPS,对比主流推理GPU50 FPS,可实现10倍性能加速。
尽管如此,由于最近贸易关系紧张,使得关于芯片话题变得更加谨慎,因此本次分享并没有提供太多新信息。不过,从软件到硬件,再到整个解决方案,这一系列努力旨在提高效率和性价比,为不同的场景提供优化后的算力支持。