芯片为什么中国做不出面对2020年15亿个AI终端的市场需求定制AI芯片成为了趋势
AI芯片为何中国做不出?面对2020年15亿个AI终端的市场需求,定制AI芯片成为了趋势。随着AI算法的逐步成熟以及芯片算力的提升,历经几年的热潮之后,AI技术只有落地应用才能获得进一步的发展。不过,算法需求与芯片算力不匹配的需求成为了AI落地的一大障碍,AI软硬一体化成为关键。但在软硬一体化提高效率的同时,如何满足多样化的需求也非常关键,定制化成为了趋势。
AI终端市场的多样化需求
这一轮AI热潮,不仅让越来越多的人认识和了解了AI技术,AI也正在成为每台智能设备日常工作的一部分。事实证明,深度神经网络(DNN)非常有用,但是AI的进一步发展和落地仍有很多挑战。比如,如何使得现有解决方案跟上发展趋势?如何扩展解决方案?如何以成熟的工具链缩短TTM(Time to Market)和降低成本?
面对这些问题,我们需要整个产业链协作共同满足市场要求。根据市场研究机构报告显示到2022年全球具有计算机视觉/机器视觉相继规模将超过15亿个,这包括智能手机、安防、消费电子、汽车图像传感器、工业等。
这意味着定制化加速器可以更好地满足不同需求,但同时边缘端也有挑战。在CEVA营销副总裁Moshe Sheier的话中,他指出,在边缘端数据量巨大且运算复杂,而芯片带宽至关重要。他认为我们希望算法公司提出更多要求,让设计能够更好地适应,以提高效率,只有效率提升了才可能更好地落地方。
提及到效率的问题,我们无法避开的是:是否专用还是通用的芯片。通用的能适应演进但性能不及专用。而Moshe Sheier相信,加速器一定是趋势,同时视频DSP在其中极其重要,因为还有许多未知性质。此刻公司不会只采用一种神经网络,而是组合使用运行多个模型就涉及CV处理,这时候CPU可能遇瓶颈。我们的XM DSP针对所有流行神经网络进行优化,更好支持多神经网络。
基于特定的理解,我们推出了第二代面向边缘设备NeuPro-S系列NPS1000/NPS2000/NPS4000,每个周期分别包含1000/2000/4000个8位MAC预配置处理器,其中NPS4000单核CNN性能达到12.5 TOPS可扩展至100 TOPS,并且内存带宽和功耗均下降40%30%。
这种性能提升主要来自硬件还是软件优化呢?Moshe Sheier表示主要是来自硬件增加离线权重压缩与硬件解压缩,以及L2内存支持减少外部SDRAM使用,对于带宽也是重点突破。这意味着NeuPro-S相较上一代尤其是在带宽上的优点,使理论利用率得到实现,同时还提供了软件框架CDNN,让客户可以自己集成驱动并进行任务分配,即CDNN会全面优化增强网络层提升利用率,是开放而高效的手段。
目前已经通过车规验证授权给汽车产品领域客户。
定制加速器作为未来趋势
值得注意的是CEVA在单统一架构中实现不同的组合,如视觉DSP和定制引擎等,使得既能满足各项需求,又能通过统一平台降低开发难度,并减少成本,为此,有些新特性或旧网现在还在演进过程中,如果要运行他们需要特殊支持,所以我们的方案既有视觉DSP又有一些新的功能,与客户一起找到最好的方式。
然而,一切从简单开始,但后续工作复杂,因此提供开放框架CDNN允许用户集成自己的驱动,从而完成繁琐工作以及大量优化由CDNN完成,将于2019底普遍授权许可。
雷锋网小结
总之,在当前不断增长中的全球15亿级别智慧设备背景下,对于企业来说,无论是微创造型产品或大型科技巨头,都必须紧跟时代脚步持续创新,以保持竞争力。如果你想了解更多关于这个话题,可以关注相关行业新闻更新,或加入专业论坛讨论最新信息!