芯片制造强国崭露头角阿里含光800 AI处理器在三大场景中的霸主地位性能超越GPU4-11倍
在2023年的一次线上云栖大会上,阿里巴巴集团的首席技术官兼阿里云智能总裁张建锋再次展现了公司在人工智能领域的创新实力。自从两年前发布含光800 AI处理器以来,这款芯片已经成为了行业内最强大的AI推理设备之一,其高调亮相至今仍引起广泛关注。
今年的线上论坛中,阿里云异构计算产品研发总监龙欣详细介绍了含光800推出后的最新进展。他提到,随着业务的不断扩展和市场需求的增长,阿里的内部AI应用领域变得更加广阔,从电商、视觉识别、语音交互到自然语言理解等多个方面都有深入应用。例如,在拍立淘这个具有2000万日活用户的大型应用中,通过AI技术实现图片搜索和商品推荐,不仅提升了用户体验,也极大地增加了数据处理能力。
龙欣强调,为了满足这些复杂场景下的性能需求,加速卷积运算和矩阵乘法是含光800的一个核心优势。此外,该芯片支持ResNet-50、SSD/DSSD、Faster-RCNN等模型,并且能够进行权重稀疏压缩及量化加速,使其成为当前市场中性能最高的人工智能处理器。
尽管没有公布新的峰值性能数据,但据之前公开资料显示,在业界标准ResNet-50测试中,含光800可以达到78563 IPS,比目前业界最好的AI芯片速度快4倍,而能效比达到了500 IPS/W,是第二名的3.3倍。此外,它在三个关键场景中的表现尤为显著:城市大脑视频分析、拍立淘商品库匹配以及行人检测,都分别展示出了4-11倍以上对传统GPU设备的超越性。
具体来说,在城市大脑视频分析中使用40个传统GPU需要300毫秒,而使用含光800仅需4颗NPU即可降低延时至150毫秒;拍立淘每天新增10亿商品图片所需时间由1小时减少至5分钟;而在行人检测任务中,每路视频帧数翻倍至100路,比主流GPU多25路;车辆检测则支持85路视频,比主流GPU多75路。在内容识别应用中的ResNet50 V2模型,其帧率可达到20000 FPS,比主流推理GPU高11倍;而对于Inception V4模型,则能够达到5000 FPS,比主流推理GPU高10.8倍。最后,在直播视频增强任务中,可达500 FPS,对比主流推理GPU为50 FPS,有10倍之差。
虽然这次分享并未提供更详尽或新鲜的情报,但它凸显了Arilai-cloud于去年的涉猎与投资所带来的长期影响,以及他们持续致力于提高整体效率与成本控制策略。这不仅表明他们正在朝着一个更加先进、高效的人工智能解决方案迈进,而且也指向了一种可能会逐渐普及全新的计算架构,为未来各类复杂计算任务打下坚实基础。