光刻机概念股的龙头股亮相新一代含光800 AI处理器三大场景实测性能超越GPU爆表4-11倍
在2023年的一次线上云栖大会上,阿里巴巴集团的首席技术官兼阿里云智能总裁张建锋再次推出了公司自研的AI芯片——含光800。这款当时最强大的AI推理芯片在2019年的第一次亮相后,再次引起了广泛关注。自那以后,一年过去了,新一代含光800已经取得了显著的进展,并且其NPU实例正式对外提供服务。
在这场线上论坛中,阿里云异构计算产品研发总监龙欣详细介绍了近一年来的最新成果。他表示:“含光800 NPU实例可以直接购买,不需要任何白名单限制,最多支持8核NPU和96核vCPU、384G内存以及网络带宽高达30Gbit/s。”这些特性使得含光800成为处理数据中心中的CNN类型模型加速任务的理想选择。
龙欣进一步强调,这款芯片不仅针对城市大脑、图像视频审核、拍立淘等具体应用进行优化,而且也支持电商应用、视觉应用、语音交互和自然语言理解等多种场景。此外,它还能实现软硬件协同工作,通过权重稀疏压缩和量化压缩来提高效率,同时支持可编程模型扩展。
据统计,在业界标准ResNet-50测试中,含光800能够达到78563 IPS,比目前市场上的最佳AI芯片性能高4倍,并且能效比为500 IPS/W,是第二名的3.3倍。不过值得注意的是,此次分享中并未提及峰值性能,而是更侧重于其实际应用能力。
具体到三大AI应用场景,其性能提升幅度各不相同。在行人检测方面,4核含光800能够支撑100路视频,比主流GPU多10倍;车辆检测则提升到了85路视频,比主流GPU增长8.5倍。而对于直播、短视频内容识别,以及点播HDR等领域,其性能加速比分别达到11倍和10.8倍。
尽管此次分享相较去年有所简化,但它依然展示了包含LED 服务器硬件设计团队成员们如何将他们对深度学习算法深入理解转换为实际部署,从而实现极致效率与成本控制。随着技术不断发展,我们期待未来更多关于这一前沿技术的创新成果。