阿里含光800 AI处理器亮相高效集成IC芯片提升人物场景性能4-11倍超GPU
在2023年的阿里云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋再次推出了公司的AI芯片含光800。这款当时最强AI推理芯片的发布不仅引起了业界的关注,也为其自研芯片的未来发展奠定了坚实基础。
一年之后,阿里的异构计算产品研发总监龙欣在今年的线上云栖大会上分享了含光800近一年的最新进展。据他介绍,含光800 NPU实例已经正式对外服务,不需要白名单就可以在阿里云实例上购买。这个实例支持8核NPU和96核vCPU、384G内存以及最高30Gbit/s网络带宽,主要面向数据中心的CNN类型模型推理加速,以及业务如城市大脑、图像视频审核、拍立淘等。
更令人振奋的是,这款未对外发售但性能已通过输出的含光800,其在具体应用中的表现令人瞩目。在电商应用中,如拍立淘,它能够帮助用户搜索商品并进行个性化推荐,这些都需要强大的AI能力。因此,通过自研硬件和软件方案提升效率和性价比是阿里的重要目标。
含光800具有深度优化CNN及视觉类算法、高能效低延时、高密度计算与存储以及软硬协同支持权重稀疏压缩等特点。此外,它还指令集支持可编程模型扩展,并覆盖FP16/BFP16向量计算,使其既针对CNN算法设计,又保持一定灵活性,以适应全栈软件支持下的特定应用和算法实现高性价比。
去年发布时,张建锋曾表示,在ResNet-50测试中,比目前业界最好的AI芯片性能高4倍,而能效比500 IPS/W,是第二名3.3倍。而今,对于具体使用情况下相较GPU有4-11倍性能提升的情况,我们得以见证这一切是否真如所言。在三大场景——城市大脑、拍立淘商品库匹配与推荐以及行人检测——中,都展示出这种显著提高。
尽管今年会议上的涉及较少,但我们仍然看到了一个趋势:即便有强大的团队能够快速设计出一款芯片,大规模落地仍需长时间努力,同时软件发挥直接作用,加速客户认可与采用。而对于接下来会发生什么,我们只能期待着更多信息将随着时间而逐渐揭开。