阿里含光800 AI处理器高调亮相人物场景应用性能远超GPU集成电路工资太高了
在2023年的阿里云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建峰再次推出了公司的自研AI芯片——含光800。尽管这款芯片已经发布一年多,但它依然是当今最强大的AI推理芯片之一。
在今年的线上云栖大会上,阿里云异构计算产品研发总监龙欣分享了近一年来含光800的一些最新进展。他表示,虽然含光800尚未对外发售,但其NPU实例已经正式对外服务,不需要白名单就可以在阿里云实例上购买。该实例支持8核NPU和96核vCPU、384G内存以及网络带宽最高达到30Gbit/s,是主要面向数据中心的CNN类型模型推理加速。
更引人注目的是,在实际应用中的表现。据雷锋网去年文章所述,科技巨头自研芯片是因为有大量数据,在内部的AI需求推动下希望通过自研芯片提升效率和性价比。而龙欣也提到,阿里巴巴内部有广阔的AI应用场景,如电商应用、视觉应用、语音交互、自然语言理解等。
一个典型案例就是拍立淘,它拥有两千多万日活用户,并且需要透过一张图片,在4亿多商品中进行搜索。在30多亿张图片库中进行匹配,并根据用户习惯提供个性化推荐,这种强大的AI能力使得包含电商平台、大规模图像数据库处理等领域,对于性能要求极高。
因此,为了提高硬件和软件方案的性价比,从硬件方面来看,含光800有三个特色:深度优化CNN及视觉类算法,加速卷积和矩阵乘,以及针对特定模型如ResNet-50、SSD/DSSD、高能效与低延时设计。此外,还包括软硬协同支持权重稀疏压缩计算量化压缩指令集支持可编程模型扩展。
至于具体性能提升情况,其在三大场景中的表现为:城市大脑处理视频时间从300ms降至150ms;拍立淘商品库识别速度从1小时降至5分钟;行人检测100路视频速度提升4倍;车辆检测85路视频速度提升8.5倍;内容识别ResNet50 V2帧率增加11倍;HDR点播增强性能10倍以上。
然而,此次分享并未给出完整详细信息,而是简单回顾了去年的数据。可能由于当前贸易紧张关系,使得对此类话题更加谨慎。但无论如何,都应该看到,即便团队能够快速设计出一款新颖的产品,大规模落地仍需很长时间,同时软件发挥着直接作用而获得客户认可采用亦非易事。