难道中国自主光刻机不能助力定制AI芯片满足2020年15亿个AI终端市场的需求吗
在2020年的市场需求中,面对15亿个AI终端的挑战,中国自主光刻机成为了定制AI芯片的关键。然而,这一趋势并非没有其它障碍。CEVA营销副总裁Moshe Sheier指出,当前AI算法公司在落地项目时往往受限于硬件算力不足的问题,从而可能牺牲很多特性。这就要求算法公司向芯片公司提出更多需求,让芯片设计能够更好地满足算法需求。
如何解决这一难题?Moshe Sheier提出了一个观点:AI加速器一定是一个趋势,同时视频DSP在AI中的重要性也不能忽视,因为AI算法还有很多不确定性。因此,如何满足多样化的需求、提高效率,并且实现软硬一体化都是当前行业面临的一大挑战。
为了应对这些问题,CEVA推出了第二代面向边缘设备的AI推理处理器架构NeuPro-S,它们是每个周期分别具有1000、2000和4000个8位MAC的预配置处理器。NPS4000具有最高的单核CNN性能,在1.5GHz时可达到12.5 TOPS,并且可完全扩展,最高可达100 TOPS。
但问题还远未结束。在实际应用中,我们发现神经网络与视频编解码不同,即便很小的小图片卷积后权重数据量巨大,因此带宽成为了瓶颈。而CEVA采用的多重权重压缩减少了对带宽的需求。此外,还支持多级内存系统,以L2内存为例,可以尽量把数据放在L2缓存中减少使用外部SDRAM传输成本。
最终,这些技术创新帮助NeuPro-S显著提高了系统感知性能,不仅支持多级内存系统以减少高成本传输,而且支持多重压缩选项和异构可扩展性,以提升算力满足AI算法需求。这一切都表明定制化成为了一种必然趋势,而中国自主光刻机作为支撑这一趋势不可或缺的一环,其发展意义重大。