后方格智能化观察网
首页 > 智能化方案 > 中国自主光刻机技术成果在阿里含光800 AI处理器亮相后三大场景应用中表现突出人脸识别等任务性能达G

中国自主光刻机技术成果在阿里含光800 AI处理器亮相后三大场景应用中表现突出人脸识别等任务性能达G

在2019年的杭州云栖大会上,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋简短介绍了阿里的首款AI芯片含光800。这款当时最强的AI推理芯片的发布就引发了巨大关注,可以说是高调亮相。

今年的线上云栖有一个芯片设计发展现状与未来的论坛,阿里云异构计算产品研发总监龙欣分享了含光800推出近一年后的最新进展。他表示:“含光800 NPU实例已经正式对外服务,不需要白名单就可以在阿里云实例上购买,实例名称是ebman1.24xlarge,最多支持8核NPU和96核vCPU,384G内存,网络带宽最高达到30Gbit/s,主要面向数据中心的CNN类型模型推理加速,业务包括城市大脑,大图像视频审核、拍立淘等。”

更引人关注的是含光800在具体应用中的表现。尽管它尚未对外发售,但其性能通过阿里云输出。正如去年雷锋网文章中所说,即科技巨头自研芯片是因为有大量数据,在内部的AI需求推动下,他们希望通过自研芯片来提升效率和性价比。

一个典型的例子就是拍立淘,它拥有两千多万日活用户。在使用这项功能的时候,要透过一张图片,在4亿多商品中搜索,在30多亿张图片库中进行匹配,并根据用户的使用习惯进行个性化推荐,这就需要很强的AI能力。因此,阿里希望通过自研的含光800从硬件到软件方案提升性价比。

做个简单回顾,含光800在硬件方面有三个方面特色:深度优化CNN及视觉类算法,加速卷积和矩阵乘,以及针对ResNet-50、SSD/DSSD、Faster-RCNN、Mask-RCNN、DeepLab等模型优化。它具有高能效、高延时、高密度计算与存储,以极大减少I/O需求,同时支持权重稀疏压缩和计算量化压缩,以及指令集支持可编程模型扩展。

去年张建峰发布含光800时说,“在业界标准ResNet-50测试中,其推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名3.3倍。”不过龙欣昨天分享并没有提及包含此信息,而是在强调其可用性,他表示,“作为并没有公开市场发售的芯片,我们通过Aril Cloud输出。”他还说明为了让含光800能够开箱即用,可自动安装NPU驱动和SDK系统方面支持公共镜像CentOS 7.6/7.7和Ubuntu 16.04,还预装主流深度学习框架,如TensorFlow 和 MXNet示范教程。

龙欣强调,其应用主要是在数据中心或大型端设备,以CNN类模型推理加速为主,可扩展至其他DNN模型中。目前已知三大场景应用中的表现显示,与GPU相比,有着4到11倍性能提升。此外,他给出了最新数据显示,在行人检测应用中4核处理器可以支撑100路视频,比主流GPU25路提高四倍。在车辆检测任务下同样也实现了85路视频处理能力,比10路主流GPU提高8.5倍。而且,对于直播内容识别以及HDR点播,都实现了显著加速效果。

然而关于语音交互自然语言理解等语言相关领域实际应用优势,则未被详细讨论。此次会议对于隐匿性的贸易关系影响,使得涉及到的话题更加谨慎。不过,从长远看,无论团队如何迅速设计出新技术,大规模落地仍然依赖于时间长久持续不断的人力资源投入,其中软件层面的作用尤为关键。一旦获得客户认可,该过程便不再那么艰难。而对于未来新的产品计划及其何时将会问世则不得而知,只能期待更多更新信息。

标签:

猜你喜欢

智能化方案 探究报告书撰写...
探究报告书撰写的关键要素及其在学术研究中的应用 引言 报告书作为学术研究成果的重要载体,对于科学界、工程技术领域乃至社会各个方面都具有深远影响。它不仅反映...
智能化方案 微波之脉无线超...
一、超越极限的传输速度 在数字化时代,信息传递的速度和准确性成为了企业竞争力的关键。UWB(Ultra-Wideband)技术以其高速率和低延迟成为了一种...
智能化方案 芯片的制作流程...
在这个信息爆炸的时代,芯片已经渗透到我们生活的每一个角落,从手机里的处理器到电脑中的显卡,再到智能家居系统中的控制单元。它们都依赖于复杂而精密的电子设备—...
智能化方案 一般报告的格式...
在工作中,我们经常需要撰写各种报告,无论是日常的项目进展报告还是年度总结报告,一个清晰、规范的格式都是必不可少的。今天,我就来分享一下我平时是怎么整理会议...

强力推荐