阿里含光800 AI处理器高调亮相三大场景应用中性能超越GPU达4-11倍提升
在2023年的阿里云栖大会上,集团首席技术官兼阿里云智能总裁张建锋对外展示了阿里的首款AI芯片——含光800。这款当时最强的AI推理芯片的发布迅速吸引了众多科技爱好者和行业专家的关注,可谓是高调亮相。
一年之后,在2024年的一场线上论坛中,阿里云异构计算产品研发总监龙欣进一步分享了含光800近一年来的最新进展。他表示,这款NPU实例已经正式开放给公众使用,不需要特殊白名单即可在阿里云实例上购买。该实例配备8核NPU、96核vCPU、384G内存,并支持30Gbit/s网络带宽,主要面向数据中心的CNN类型模型推理加速,其业务涉及城市大脑、图像视频审核以及拍立淘等应用。
更值得注意的是,尽管含光800尚未对外发售,但其性能已经通过阿里云输出。据统计,在特定的应用场景中,与GPU相比,含光800能够实现4-11倍的性能提升。
其中一个典型案例就是拍立淘,该平台拥有超过两千万活跃用户,每天都要处理大量图片以进行商品搜索和个性化推荐,这些任务依赖于强大的AI能力。因此,通过自主研发硬件到软件方案来提升效率和性价比,是阿里的核心目标之一。
至于具体表现方面,从去年的数据可以看出,在城市大脑中的实时视频处理中,只需4颗含光800就能完成40颗传统GPU所需300ms时间内完成;而在拍立淘商品库每天新增10亿商品图片识别任务中,可以缩短从1小时到5分钟。此外,在行人检测应用中,可支持100路视频,比主流GPU25路提升4倍;车辆检测则可支持85路视频,比主流GPU10路提升8.5倍。在ResNet50 V2模型中的帧率可以达到20000 FPS,比主流推理GPU1800 FPS性能提升11倍。而Inception V4模型下,帧率达到了5000 FPS,比主流推理GPU460FPS性能加速比高10.8倍。在直播质量增强方面,可达到500 FPS,对比50 FPS,加速比为10倍。在点播HDR中,则有66 FPS,使得与英伟达A100相比实现6.6倍的性能加速。
不过,由于当前国际形势复杂,加之贸易关系紧张,对于芯片相关话题的讨论变得更加谨慎,因此今年云栖大会上的关注度并不高。此次分享也没有提供新的丰富场景介绍,或许未来会有更多关于下一代AI芯片发布的情况发生。但不管如何,一旦落地,它将是数字经济发展的一个重要驱动力。