在社会的舞台上Imagination性能高达600 TOPS的终极AI加速器即将问鼎Nvidia是否
在科技的浪潮中,Imagination Technologies,一度统治手机GPU IP市场的老牌巨头,如今虽在移动GPU IP市场占据36%,汽车GPU IP市占率高达43%,但仍然面临着新的挑战。近日,Imagination发布了经过两年研发的第三代神经网络加速器(NNA)产品IMG Series4,这一全新多核架构能提供600 TOPS(每秒万亿次操作)的超高性能,主要针对先进驾驶辅助系统(ADAS)和自动驾驶领域。
这一终极AI加速器不仅展现了其实力,也引起同行们对于这位老对手的重视。在AI火热的2017年,Imagination推出了首代神经网络加速器(NNA)PowerVR 2NX,其单核性能从1TOPS提升至4.1TOPS。而紧接着2018年的PowerVR 3NX发布,不仅单核性能从0.6TOPS增至10TOPS,更是将多核产品性能从20TOPS扩展至160TOPS。
此外,随着时间推移,Imagination NNA不仅拓展到了智能相机监控、消费电子尤其是数字电视以及低功耗IoT智能设备领域,还强调了全新的多核架构设计,这样的设计支持在多个内核之间灵活分配和同步工作负载,从而实现更高效能。
Gilberto Rodriguez表示:“我们的软件提供精细控制能力,并通过批处理、拆分和调度提高灵活性,可以在任意数量内核上使用。Series4可为每个集群配置2个、4个、6个或者8个内核。一个8内核集群可以提供100 TOPS算力,而配有6组这样的解决方案就能达到600 TOPS。” 这意味着这种新技术能够以比嵌入式CPU快1000倍,比嵌入式GPU快20倍以上的速度进行AI推理。
Andrew Grant指出:“虽然市场上已经有满足自动驾驶需求的AI芯片,但功耗问题依旧存在。我们花费两年时间理解客户需求,以前两代低功耗产品为基础,我们推出了高性能低功耗的4NX系列产品,并且将自动驾驶作为主打市场。”
尽管如此,对于如何兼顾600 TOPS级别的大规模计算与保持低功耗的问题,该技术仍需进一步探讨。在5nm节点上实现超过30 TOPs/Watt 的性能功耗比,以及超过12 TOPs/mm^2 的性能密度,这对于大规模数据处理来说是一个巨大的挑战。此外,由于数据搬运过程中的能源消耗远大于实际处理,因此必须找到有效减少数据搬运并降低延迟的手段。
为了应对这些挑战,该团队采用了一种名为Tensor Tiling(ITT)的技术。这是一项正在申请专利的事务,它利用本地存储空间保存依赖性的中间数据,从而最大限度地减少将数据传输到外部存储设备所需带宽。这一措施使得特征图交换过程中需要通过内部存储进行融合更多层次,从而显著提升效率并节省带宽,同时还允许开发者使用编译器来完成任务拆分,而不是手动调整,使得整个流程更加简化和可管理。
总之,在即将到来的量产阶段,即3nm芯片何时量产,将成为推动这一革命性的发展步伐的一部分。而对于Nvidia在自动驾驶领域目前的地位,该公司是否能够承受来自如今拥有36%移动GPU IP市场份额及43%汽车GPU IP市占率优势下的竞争者的威胁,则成为了观察点之一。在接下来的岁月里,我们期待看到这些创新技术如何影响未来车辆制造业乃至整个社会结构。