中国芯片自主创新为何难含光800 AI处理器在人物识别场景下的亮眼表现突显GPU性能差距
在2023年的阿里云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋再次推出了公司的自主研发AI芯片——含光800。尽管这款当时最强AI推理芯片的发布已经引起了巨大的关注,但今年的线上云栖大会中,却并没有给予它太多关注度。
然而,在昨天的论坛上,阿里云异构计算产品研发总监龙欣分享了近一年来含光800的一些最新进展。他表示,含光800 NPU实例现在已经正式对外服务,不需要白名单就可以在阿里云实例上购买,这对于数据中心的CNN类型模型推理加速尤为重要。
更值得注意的是,尽管包含拍立淘这样的应用场景,其日活用户超过两千万,每天新增10亿商品图片进行匹配,但实际应用中的表现仍然令人瞩目。比如,在行人检测应用中,4核含光800支持100路视频,比主流GPU 25路性能提升4倍。在车辆检测中同样是4核含光800,可以支持85路视频,比主流GPU支持10路性能提升8.5倍。而在直播、短视频等内容识别应用中的ResNet50 V2模型中,含光800(4核)的帧率可以达到20000 FPS,比主流推理GPU性能提升11倍。
不过,即便如此,对于是否能够大规模落地和获得客户认可,还存在很长一段时间。软件在此过程中的作用显著,而不是简单依赖硬件。这也反映出中国芯片自主创新面临的一个挑战:即使有强大的团队设计出高性能芯片,但要真正实现市场化运作,并且获得广泛采用仍需付出更多努力。