阿里含光800 AI处理器高调亮相芯片的基本结构如同一位才女她的舞台是数据流舞步是算法运行而她的精彩
阿里巴巴集团首席技术官兼阿里云智能总裁张建锋在2019年杭州云栖大会上隆重发布了自家的AI芯片含光800,引发科技界巨大关注。近日,在今年的线上云栖大会上,阿里云异构计算产品研发总监龙欣详细介绍了这款AI推理芯片的一年来最新进展。
龙欣表示,含光800 NPU实例已经正式对外服务,无需白名单即可在阿里云实例上购买。该实例支持8核NPU和96核vCPU、384G内存以及最高30Gbit/s网络带宽,主要面向数据中心的CNN类型模型推理加速,如城市大脑、图像视频审核、拍立淘等应用。
更值得一提的是含光800在实际应用中的出色表现。在拍立淘这样的电商应用中,该芯片能够帮助用户通过一张图片快速搜索商品,从而提供个性化推荐。这就需要强大的AI能力,以及高效且低延时的处理能力。
至于具体性能提升方面,龙欣指出,由于未对外发售,因此性能通过阿里云输出。他强调,其主要应用场景是在数据中心和大型端,以CNN类模型推理加速为主,可扩展到其他DNN模型中。而相比GPU,其后三大场景(如城市大脑、行人检测与车辆检测)显示出的性能提升分别是4-11倍。
例如,在行人检测与车辆检测方面,每增加1个含光800核心,便能支持10路视频,比主流GPU多6倍。此外,在ResNet50 V2模型中的帧率可以达到20000 FPS,比主流推理GPU高11倍;Inception V4模型则达到了5000 FPS,比主流GPU高10.8倍。对于直播质量增强,这款芯片同样有显著提升,对比50 FPS的主流GPU,更是实现了10倍的性能加速比。
尽管此次分享没有提供丰富的情境,但仍然展示了含光800作为一个专门针对深度学习任务优化设计的硬件,它不仅提高了算力的效率,还降低了成本,为各种复杂计算任务带来了新的可能。随着技术不断迭代,我们期待未来更多关于这一领域发展的情况报告。