在社会的舞台上Imagination性能高达600 TOPS的终极AI加速器是否能成为半导体领域的新
在科技的浪潮中,Imagination Technologies,这个曾经统治手机GPU IP市场的巨头,在经过一系列变动后,现在在移动GPU IP市场占有率达到了36%,而在汽车GPU IP市占率高达43%。近期,Imagination推出了全新的第三代神经网络加速器(NNA)产品IMG Series4,它不仅展现了公司实力的强大,也让同行们对这位老对手产生了更大的关注。
11月13日,Imagination正式发布了耗时两年的最新神经网络加速器产品IMG Series4,其采用全新的多核架构,可以提供600 TOPS(每秒万亿次操作)的超高性能,并且主要面向先进驾驶辅助系统(ADAS)和自动驾驶应用领域。
以低功耗产品见长的Imagination Technologies推出了一款高性能的终极AI加速器,该设备是否能给已经在自动驾驶汽车芯片市场占据领导地位的Nvidia带来挑战?这个问题引起了广泛讨论。
为了回答这个问题,我们需要回顾一下过去几年的发展历程。2017年,Imagination推出了首代神经网络加速器(NNA)PowerVR 2NX,当时单核性能从1TOPS提升到4.1TOPS。紧接着,在2018年,他们发布了PowerVR 3NX,每个单核性能从0.6TOPS增加到10TOPS,而多核产品则从20TOPS增长到160TOPS。此外,随着时间的推移,新一代AI技术也被应用于智能相机监控、消费电子以及低功耗IoT智能设备等领域。
现在,我们迎来了第三代NNA产品——4NX。这一系列单核能够以不到1瓦的功耗提供12.5 TOPS 的性能,比之前两代都要强大。而最令人瞩目的,是它全新的多核架构支持灵活分配和同步工作负载,从而实现更高效能。在一个集群中,可以配置2个、4个、6个或8个内核,每组8内核可以达到100 TOPS 的算力,而6组这样的集群就能达到600 TOPS 的算力。
Gilberto Rodriguez表示,“我们的软件提供精细控制能力,并通过对多任务进行批处理、拆分和调度来提高灵活性。”他还提到,这种设计使得Series4 NNA比嵌入式GPU快20倍以上,比嵌入式CPU快1000倍,对于AI推理来说是非常关键的一步。
Andrew Grant进一步解释说:“虽然市场上已经有满足自动驾驶需求的AI芯片,但他们可能无法同时保持高性能与低功耗。因此,我们花费两年时间了解客户需求,以及基于我们前两代低功消品,再次推出了具有高性能又低功消品特性的4NX系列。”
对于如何兼顾600 TOPS 的高性能与低功耗的问题,Gilberto Rodriguez指出:“我们使用5nm工艺制备这些核心,使其拥有超过30 TOPs/Watt 的峰值效率,以及超过12 TOPs/mm^2 的密度。这意味着尽管它们拥有如此巨大的计算能力,它们却只消耗很少电力。”
除了表现出色的计算能力之外,这些新型核心还采用了一种名为Tensor Tiling(TT)的技术,以减少数据传输并节省带宽。此外,还有一种叫做“拆分”的方式,让不同的内核独立运行,即使是在执行相同任务的情况下,也可以提高并行处理速度和吞吐量。
然而,最重要的是这些核心如何融合成一个整体,以确保它们既能够快速处理大量数据,又不会因为太过复杂而导致延迟增加。在这种情况下,加速度将会成为决定因素,因为如果延迟过长,那么即使再怎么样的计算能力也没用武之地。
最后,由于这项技术仍处于开发阶段,所以所有这些潜在优势都必须得到实际测试。但无疑,对于任何想要进入这一高速增长领域的人来说,都需要考虑到的就是此类工具链所需具备哪些功能,以及它们如何帮助开发者迅速部署自己的解决方案。这是一个充满竞争激烈环境,其中各方都试图获得优势,以便将自己打造成行业标准之一。在这一过程中,不仅仅是关于谁能生产最好的硬件,更是关于谁能有效利用那些硬件以创造真正价值的情境考验。