芯片解密公司阿里含光800 AI处理器耀眼登场三大应用场景实测性能超越GPU4-11倍
在2023年的一次线上云栖大会上,阿里巴巴集团的首席技术官兼阿里云智能总裁张建锋再次展现了公司在人工智能领域的最新进展。自从两年前发布其首款AI芯片含光800以来,这款芯片已经取得了显著的成就,并且在高调亮相后,已正式对外服务。
今年的线上云栖大会中,有一个专门针对芯片设计发展现状与未来的论坛。在这个论坛上,阿里云异构计算产品研发总监龙欣详细介绍了含光800推出近一年后的最新进展。他强调:“我们为用户提供了一种全新的方式来购买和使用NPU实例,不需要任何白名单限制,只需简单地选择ebman1.24xlarge实例,即可获得支持8核NPU和96核vCPU、384G内存以及最高30Gbit/s网络带宽的性能。”
更令人振奋的是,含光800在具体应用中的表现。尽管它尚未公开销售,但其性能已经通过阿里云输出并得到了验证。在一系列典型应用场景中,比如城市大脑、图像视频审核以及拍立淘等,它都显示出了显著的优势。例如,在处理杭州主城区交通视频时,传统GPU所需40颗处理器与4颗含光800相比,其延时从300ms缩短至150ms;而拍立淘商品库每天新增10亿商品图片的情形下,用传统GPU识别需要1小时,而用含光800仅需5分钟。
龙欣还提到,在行人检测应用中,4核含光800能够支持100路视频,比主流GPU多25路;而在车辆检测中,它能支持85路视频,比主流GPU多75路。此外,在ResNet50 V2模型中的内容识别应用中,4核含光800可以达到20000 FPS,比主流推理GPU速度提升11倍;而Inception V4模型中的处理帧率也达到了5000 FPS,比主流推理GPU提升10.8倍。
此外,还有直播、点播、短视频等视频质量增强方面,其中包括直播视频增强性能500 FPS,对比主流推理GPU为50 FPS,加速比达到10倍,以及点播HDR实现66 FPS,与英伟达A100训练所需时间相比提高6.6倍。
虽然这一年的关注度可能没有去年那么高,但我们应该看到的是,无论是硬件还是软件层面,都有巨大的潜力待挖掘。而对于未来,我们期待着更多关于下一代AI芯片将如何继续深化这些优势并开启新的可能性。