中国芯片排行榜2022最新Imagination性能高达600 TOPS的终极AI加速器将如何影响社
在中国芯片排行榜2022最新的背景下,Imagination Technologies近期推出了性能高达600 TOPS的终极AI加速器,这一产品不仅展现了其技术实力,也引起了同行业对老对手的关注。作为移动GPU IP市场占有率36%,汽车GPU IP市占率43%的公司,Imagination Technologies以低功耗产品见长,其新推出的高性能AI加速器将如何影响社会,以及给Nvidia带来的挑战,是值得关注的话题。
11月13日,Imagination Technologies发布了耗时两年研发的第三代神经网络加速器(NNA)产品IMG Series4,该系列采用全新的多核架构,可提供超高性能,并且主要面向先进驾驶辅助系统(ADAS)和自动驾驶应用。在AI火热的2017年,Imagination就推出首代神经网络加速器(NNA)PowerVR 2NX,但当时单核性能只有1TOPS。随后,在2018年PowerVR 3NX发布,每个单核能提供10TOPS,而多核产品性能从20TOPS到160TOPS。这次推出的4NX系列每个单核能以不到1瓦的功耗提供12.5TOPS。
新一代产品强调的是全新的多核架构,这个新的多核架构支持在多个内核之间对工作负载进行灵活分配和同步,从而实现更高性能。据Gilberto Rodriguez介绍,“我们的软件提供了精细控制能力,并通过对多个工作负载进行批处理、拆分和调度而提高了灵活性,可以在任意数量内核心上使用。”Series4可为每个集群配置2、4、6或8内核心,每一个8内核心集群可以提供100 TOPS算力,而配有6个8内核心集群则可以达到600 TOPS算力。
对于为什么要推出如此高性能的AI加速器,Gilberto Rodriguez表示,“ADAS和自动驾驶对芯片有很高计算需求,比如L2+级别的人机协作或者语音/手势控制需要10 TOPs计算能力,而L3-L4级别要求50-100 TOPs,对于L5级别则是超过500 TOPs。”
然而,对于是否能够兼顾低功耗的问题,Andrew Grant提到了Tensor Tiling技术,该技术利用本地数据依赖性将中间数据保存在片上存储器中,以减少数据传输至外部存储所需带宽,同时降低延迟。此外,由于Tensor Tiling技术中的批处理和拆分功能,它们能够提升并行处理能力,同时减少网络推理延迟。
尽管Nvidia已经在自动驾驶领域处于优势地位,但这次Imagination Technologies与其合作伙伴一起进入这一市场,将会给现有的竞争者带来压力。而由于其专注于移动端以及IP供应商的地位,它们可能会更好地满足电动汽车等电池供电设备对于功耗要求严格的情况。此次推出的NX4还包含IP级别安全功能且设计流程符合ISO 26262标准,为车规级生产做好了准备。