深圳芯片巨擘抢先体验含光800 AI处理器在三大场景下超越GPU性能飙升4-11倍
2019年杭州云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋在简短的介绍中披露了阿里的首款AI芯片含光800,这款当时最强大的AI推理芯片的发布极大地吸引了人们的关注。如今,在今年的线上云栖大会上,阿里云异构计算产品研发总监龙欣分享了含光800推出近一年后的最新进展。
据龙欣介绍,含光800 NPU实例已经正式对外服务,不需要任何白名单即可在阿里云实例上购买。这些实例支持8核NPU和96核vCPU、384G内存以及网络带宽最高达到30Gbit/s。主要面向数据中心的CNN类型模型推理加速,其业务包括城市大脑、图像视频审核以及拍立淘等。
更令人关注的是,尽管含光800尚未对外发售,但其性能通过阿里云输出已为人所知。在去年的文章中提到过,由于科技巨头自研芯片是因为有大量数据,以及内部AI需求推动下,他们希望通过自研芯片来提升效率和性价比。而这次线上的分享中,龙欣也强调了这一点,他指出,在电商应用、视觉应用、语音交互和自然语言理解等方面,都有广阔的AI应用需求。
例如,对于拍立淘这样的应用,它每天新增10亿商品图片,而使用传统GPU算力识别需要1小时,用含光800后则可以缩减至5分钟。这体现出了含光800在特定场景下的高效性。除此之外,还有行人检测和车辆检测等其他应用,也展示了包含8颗NPU处理器与4颗vCPU处理器,可以提供远超主流GPU性能水平的大幅提升。
另外,在直播、短视频及商品信息流等内容识别应用中的ResNet50 V2模型中,含光800(4核)的帧率达到20000 FPS,比主流推理GPU性能提升11倍;而在Inception V4模型中,该设备(4核)能够处理5000 FPS,比主流推理GPU性能加速比达到了10.8倍。此外,对于点播HDR功能,该设备(4核)的多样化能力为66 FPS,与主流GPU相比提高6.6倍。
虽然今年的共享没有给出新的峰值性能数据,但强调其可用性,并且由于市场紧张的情况下,对话题更加谨慎。但从实际使用角度看,即便具有如此先进技术,如果想要大规模落地仍然需要很长时间,这个过程软件发挥着非常直接作用,同时获得客户认可并采用也并非易事。