中国芯片强悍再现阿里含光800 AI处理器震撼亮相三大关键场景性能爆发GPU比拼无悬念
在中国芯片强悍再现的浪潮中,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋于2019年杭州云栖大会上引领了新篇章——揭开含光800这款最强AI推理芯片的神秘面纱。自那时起,科技界一直在期待这一革命性的突破如何在实践中展现其价值。
今年,在2023年的线上云栖大会上,阿里云异构计算产品研发总监龙欣带来了最新进展报告。含光800 NPU实例已经正式对外服务,不仅无需白名单,即可在阿里云实例上购买,而且配置令人瞩目的性能:支持8核NPU和96核vCPU、384G内存以及网络带宽高达30Gbit/s。这使得它成为处理数据中心CNN类型模型推理加速的完美选择,无论是在城市大脑、图像视频审核还是拍立淘这样的应用场景中,都能体现出其卓越表现。
更值得一提的是,尽管含光800尚未对外发售,但其性能已经通过阿里云输出,让世界见证了它的惊人能力。在电商应用、视觉应用、语音交互乃至自然语言理解等众多领域,都有着广阔的应用前景。例如,在拍立淘这样拥有两千多万日活用户的大型平台中,其AI能力不仅能够快速搜索商品,还能提供个性化推荐,这一切都建立在强大的AI基础之上。
为了提升硬件与软件之间的协同效率,含光800采用深度优化CNN及视觉类算法,加速卷积和矩阵乘,同时针对ResNet-50等模型进行特定优化。此外,它还具备高能效低延时、高密度计算与存储,以及软硬协同支持权重稀疏压缩等多项优势,使其成为适应未来新激活函数需求的一款灵活芯片。
去年发布时,张建锋宣布含光800在业界标准ResNet-50测试中的推理性能达到78563 IPS,比目前业界最好AI芯片性能高4倍,并且以500 IPS/W的能效比,是第二名3000IPS/W芯片的3.3倍。但是,此次分享并未披露峰值性能,而是重点展示了其可用性和实际应用中的表现。
据统计,在三大关键场景中,比如城市大脑、行人检测以及车辆检测等涉及到的GPU相比,可实现4-11倍甚至更高级别的心智加速。在行人检测方面,它可以支持100路视频,与主流GPU相比提升了4倍;而车辆检测则达到85路视频,与主流GPU相比提升了8.5倍;而对于内容识别任务,如直播短视频商品信息流,可以实现20000 FPS帧率,与主流GPU相差11倍之巨!
虽然此次分享没有为我们揭示下一个版本或接下来将会发生什么,但依照过去几年的趋势,我们可以预见到,一旦技术迭代成功,将会有更多令人瞩目的创新出现。那么,当我们回望未来,也许不久之后,我们将目睹另一颗新的星辰闪耀,而其中隐藏着更加惊人的力量与潜力待发现。