国内50强芯片公司排名2021阿里含光800 AI处理器在人物识别场景下表现突出性能比GPU高4-1
在2021年的云栖大会上,阿里巴巴集团的首席技术官兼阿里云智能总裁张建锋简要介绍了他们的新AI芯片——含光800。这款芯片在发布时就引起了广泛关注,并被认为是当时最强大的AI推理芯片之一。
一年后,在同一平台上的一个关于芯片设计发展现状与未来的论坛上,阿里云异构计算产品研发总监龙欣分享了含光800近一年来的一些最新进展。他表示,这款NPU实例已经正式对外提供服务,不需要白名单即可购买。它支持8核NPU和96核vCPU、384G内存以及网络带宽最高达到30Gbit/s,主要面向数据中心的CNN类型模型推理加速,其业务包括城市大脑、图像视频审核以及拍立淘等。
更值得注意的是含光800在实际应用中的表现。尽管它尚未公开销售,但其性能已经通过阿里云输出。据报道,该芯片在三个典型场景中展示了4-11倍的GPU性能提升。在城市大脑应用中,它能够实时处理杭州主城区交通视频,而只需4颗含光800,而不是40颗传统GPU;对于拍立淘商品库每天新增10亿商品图片识别任务,它可以缩短从1小时到5分钟。
龙欣还提到了其他两个应用场景,其中包括行人检测和车辆检测。在行人检测中,4核含光800能够支持100路视频,比主流GPU多25路;而在车辆检测中,它可以支持85路视频,比主流GPU多75路。此外,在ResNet50 V2模型中的内容识别应用中,含光800(4核)的帧率可达20000 FPS,比主流推理GPU高11倍;而Inception V4模型中的处理帧率为5000 FPS,比主流推理GPU高10.8倍。
此外,还有直播、点播和短视频等视频质量增强方面的优势。例如,对于直播视频增强,4核含光800可以实现500 FPS,对比主流推理GPU为50 FPS,是10倍快。而对于点播HDR任务,其性能是66 FPS,对比英伟达A100训练所需时间长达10 FPS,可实现6.6倍性能加速。
虽然今年的分享没有给出完整数据,并且可能由于贸易关系紧张导致关注度下降,但这并不影响我们看到,一旦这些先进技术得到广泛采用,将会产生显著效益。此外,由于软件对这一过程扮演着直接作用,以及客户认可和采用的重要性,我们仍然期待未来更多具体细节及案例研究,以深入了解这一领域发展动态。