阿里含光800 AI处理器高调亮相犹如一位舞者轻盈跃台其芯片的好处在三大场景中展现出惊人的力量比GP
在2019年的云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋隆重发布了公司的首款AI芯片——含光800,这款当时最强大的AI推理芯片的问世,让整个科技界为之瞩目。经过一年多的时间,阿里云异构计算产品研发总监龙欣在今年的线上云栖论坛中分享了含光800近一年来的最新进展。
他表示,含光800 NPU实例已经正式对外服务,不需要白名单就可以在阿里云实例上购买。这种高性能的处理器,最多支持8核NPU和96核vCPU、384G内存,以及网络带宽最高达到30Gbit/s。它主要面向数据中心的CNN类型模型推理加速,应用于城市大脑、图像视频审核以及拍立淘等领域。
更值得关注的是,在实际应用中的表现。在没有对外发售的情况下,其性能通过阿里云输出。这是因为科技巨头自研芯片是基于大量内部数据驱动,而希望通过自研芯片来提升效率和性价比。例如,在拍立淘这个功能中,有着两千多万日活用户,它需要透过一张图片,在4亿多商品中搜索,并在30多亿张图片库中进行匹配,以此提供个性化推荐,这就需要很强大的AI能力。
含光800在硬件方面有三个特色:深度优化CNN及视觉类算法,加速卷积和矩阵乘,以及针对特定模型如ResNet-50、SSD/DSSD等进行优化。此外,它还具有高能效、低延时、高密度计算与存储,以及软硬协同支持权重稀疏压缩和量化压缩能力。
去年,当张建锋发布含光800时,他提到该处理器在业界标准ResNet-50测试中的推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;而其能效比500 IPS/W,是第二名的3.3倍。不过,此次龙欣并未提及其峰值性能,而是强调了其可用性,即便如此,对于购买实例用户来说,只需自动安装NPU驱动和SDK即可开箱即用。
至于具体应用中的表现,一些数据显示,在行人检测应用中,4核含光800支持100路视频,比主流GPU 25路提升4倍;车辆检测则支持85路视频,比主流GPU10路提升8.5倍。在内容识别应用中的ResNet50 V2模型中,帧率可达20000 FPS,比主流推理GPU1800 FPS提升11倍。而对于点播HDR,则实现6.6倍性能加速比。
尽管这次分享给出的场景相较于去年不够丰富,但仍然展示了含光800在三大AI场景中的4-11倍性能提升。未来是否会有新的更先进型号出炉,还待观察。不过,无论如何,这样的发展都表明了中国企业正在逐步崛起,将自身技术与全球竞争者相抗衡,为数字经济时代提供更加稳固的地基。