深圳芯片巨擘之首的阿里含光800宛若夜空中璀璨的星辰它在AI处理器领域的高调亮相以其在三大核心场景中
在深圳的芯片公司前十名之首的阿里含光800,犹如夜空中最亮的星辰,它以其AI处理器领域的高调亮相,在三大核心场景中的落地性能,如同猛虎下山,无人能敌。自从2019年杭州云栖大会上首次亮相以来,这款当时最强AI推理芯片就引起了巨大的关注。
今年,阿里线上云栖举办了一个芯片设计发展现状与未来的论坛,阿里云异构计算产品研发总监龙欣分享了含光800推出近一年后的最新进展。他表示,含光800 NPU实例已经正式对外服务,不需要白名单就可以在阿里云实例上购买,以ebman1.24xlarge为实例名称,最多支持8核NPU和96核vCPU、384G内存、网络带宽最高达到30Gbit/s,主要面向数据中心的CNN类型模型推理加速,业务包括城市大脑、图像视频审核和拍立淘等。
更值得一提的是含光800在具体应用中的表现。在电商应用中,如拍立淘,其日活用户数超过两千万,每天新增10亿商品图片,对于这样的庞大数据量,只有强大的AI能力才能应对。这正是阿里的目标——通过自研硬件到软件方案提升性价比。
龙欣指出,含光800在硬件方面有三个特色:深度优化CNN及视觉类算法,加速卷积和矩阵乘,以及针对ResNet-50、SSD/DSSD、Faster-RCNN、Mask-RCNN、DeepLab等模型优化。同时,它具有高能效低延时、高密度计算与存储以及软硬协同支持权重稀疏压缩等特点。
尽管去年张建锋发布含光800时宣称其业界标准ResNet-50测试性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍,但龙欣并没有提及新数据,而是强调其可用性。对于未来,他表示:“我们希望通过自研的含光800从硬件到软件方案提升性价比。”
至于实际应用中的表现,与GPU相比,有四到十一倍性能提升。在行人检测应用中,可支持100路视频;车辆检测可支持85路视频;而直播或短视频内容识别,则可以实现帧率20000 FPS或5000 FPS,比主流GPU提高11倍或10.8倍。此外,在HDR点播中,也实现了6.6倍性能加速比。
虽然此次分享给出的信息不如去年丰富,但它展示了一种可能性,即即使存在贸易紧张关系,也有一种技术力量能够超越这些挑战,并且可能成为未来科技行业的一个重要趋势。而对于下一代AI芯片何时推出,还需继续关注雷锋网相关文章更新。