2022年手机处理器性能排行榜阿里含光800 AI超能量引擎亮相后三大场景爆表AI处理器霸榜GPU相
在2022年的一次盛大的科技大会上,阿里巴巴集团的首席技术官兼阿里云智能总裁张建锋以简洁而有力的方式介绍了他们研发的AI芯片——含光800。这款当时最强大的AI推理芯片的发布引起了广泛关注,就像一颗耀眼的星辰在科技界闪亮。
一年后,在一次线上云栖会议上,阿里云异构计算产品研发总监龙欣分享了近一年来的最新进展。龙欣表示,含光800 NPU实例已经正式对外服务,无需白名单即可在阿里云实例中购买。这些实例配置高达8核NPU和96核vCPU、384G内存,以及网络带宽最高达到30Gbit/s,主要面向数据中心中的CNN类型模型推理加速,其应用包括城市大脑、图像视频审核以及拍立淘等。
更值得注意的是,这款未对外发售的芯片性能通过阿里云输出。据雷锋网去年的报道显示,科技巨头自研芯片是因为内部大量数据驱动,并希望通过自研提升效率和性价比。在昨天的线上分享中,龙欣也提到,阿里巴巴内部拥有广阔的AI应用场景,如电商应用、视觉应用、语音交互和自然语言理解等。
一个典型案例就是拍立淘,它拥有两千多万日活用户,每天需要搜索4亿多商品图片,从30多亿张图片库中进行匹配,并根据用户习惯提供个性化推荐,这些都需要极强的大数据处理能力。因此,阿里的目标是通过自研硬件与软件方案来提升性价比。
含光800在硬件设计方面有三个特色:深度优化CNN及视觉类算法,加速卷积和矩阵乘支持反卷积、孔洞卷积、三维卷积及插值操作;针对ResNet-50、SSD/DSSD、Faster-RCNN/Mask-RCNN及DeepLab等模型进行优化;具有高能效低延时、高密度计算与存储减少I/O需求软硬协同支持权重稀疏压缩计算量化压缩指令集支持可编程模型扩展覆盖FP16/BFP16向量计算直接加速各种激活函数并支持未来新型激活函数。
尽管去年张建锋宣布含光800在业界标准ResNet-50测试中的推理性能为78563 IPS,比目前业界最好的AI芯片性能高4倍且能效比500 IPS/W,是第二名3.3倍,但是在昨天的分享中没有提及其峰值性能,而是强调其可用性。他表示:“作为未曾公开市场销售过的芯片,我们将它通过阿里云输出。”
为了让用户能够开箱即用使用NPU功能,系统自动安装NPU驱动和SDK,并预装主流深度学习框架TensorFlow/MXNet提供示范教程。此外,由于包含公共镜像CentOS 7.6/7.7 和Ubuntu 16.04,还可以自动安装所需工具,使得整个过程更加便捷。
至于实际应用情况,上述三大场景表现出显著优势,比GPU提升了4-11倍。在城市大脑实现40颗传统GPU延迟300ms,而使用含光800仅需4颗延迟150ms;拍立淘识别时间从1小时缩短至5分钟;行人检测100路视频FPS翻番车辆检测85路视频FPS翻番10倍以上,对应Inception V4处理帧数增加到了5000 FPS,以此类推皆展示出明显增强效果。
然而关于语音交互或自然语言理解领域具体优势则没有给出详细数字。
总结来说,即使去年被高度关注但今年看似不再那么火热,不过这是由于当前复杂国际环境下对敏感话题更谨慎。而这一切仍然只是开始阶段,因为真正落地还需要很长时间,而且软件对于这个过程扮演着关键角色获得客户认可采用并不容易。
那么何时会有一代新的AI芯片问世呢?只有时间才能给我们答案。但无疑,这些努力正在逐步铺设出未来智能世界道路上的坚固基石。