芯片封装工艺流程新纪元阿里含光800 AI处理器闪耀亮相三大场景应用性能爆表GPU比拼力度4-11倍
2019年杭州云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋的简短介绍激发了对新兴AI芯片含光800的巨大期待。经过一年时间的研发与迭代,这款当时业界最强大的AI推理芯片再次登场,以其突破性的性能和创新性设计吸引了科技界各方专家的关注。
在今年的线上云栖大会上,阿里云异构计算产品研发总监龙欣深入探讨了含光800自发布以来的最新进展。他指出,该NPU实例已经正式开放给所有用户,无需特殊白名单即可在阿里云平台购买使用。此外,它支持8核NPU和96核vCPU、384G内存以及30Gbit/s网络带宽,主要面向数据中心中的CNN类型模型推理加速,并广泛应用于城市大脑、图像视频审核以及拍立淘等多个领域。
更值得关注的是,尽管含光800尚未对外进行销售,其性能通过阿里云平台输出已证明其卓越能力。在电商应用中,如拍立淘,其强大的AI能力使得用户能够快速找到商品,即便是在4亿多种商品中寻找特定物品也能迅速完成。而这背后,是一套从硬件到软件全面优化的方案,其中包括深度优化CNN及视觉类算法、高能效低延时、高密度计算与存储,以及软硬协同支持权重稀疏压缩和量化压缩等多项技术。
据统计,在ResNet-50测试中,含光800表现出了78563 IPS,比目前业界最好的AI芯片高4倍;同时,其能效比达到了500 IPS/W,比第二名高3.3倍。龙欣表示:“我们致力于提供开箱即用的体验,让用户可以自动安装NPU驱动和SDK,同时系统支持公共镜像CentOS 7.6/7.7和Ubuntu 16.04,还预装主流深度学习框架。”
在三大关键场景——城市大脑、图像视频审核以及拍立淘——含光800展示出了令人瞩目的性能提升:相比GPU,它分别实现了4-11倍以上的加速效果。在行人检测应用中,可支撑100路视频;车辆检测则可处理85路视频;而在内容识别应用中,可达到20000 FPS帧率,加速比达到了11倍。此外,在直播点播HDR方面,也实现了10倍以上的加速效果。
尽管这一系列成果令人印象深刻,但显然,由于当前全球贸易紧张的情况,对此次分享可能存在一定程度上的谨慎态度。不过,从这些数据来看,不难预见,即便是具有如此强大团队背景下所创造出的技术解决方案,要真正落地并获得市场认可仍将是一个漫长且复杂过程。这标志着阿里的未来发展之路依旧充满挑战,而对于行业内部外部伙伴来说,也为今后的合作与竞争提供了一定的思考空间。