社会面临的挑战高昂集成电路工资将如何影响Nvidia终极AI加速器的市场竞争
在科技的浪潮中,Imagination Technologies,这个曾经统治手机GPU IP市场的巨头,在汽车GPU IP领域占有率高达43%,移动GPU IP领域则占据36%的市场份额。近期,Imagination发布了全新的第三代神经网络加速器(NNA)产品IMG Series4,其多核架构能够提供600 TOPS甚至更高的性能,为自动驾驶和先进驾驶辅助系统(ADAS)提供强劲支持。
作为对AI火热2017年的回应,Imagination推出了首代神经网络加速器PowerVR 2NX,其单核性能从1TOPS提升至4.1TOPS。紧接着是2018年的PowerVR 3NX,它们单核性能从0.6TOPS增长到10TOPS,而多核产品性能从20TOPS增加到160TOPS。此外,NNA主要面向智能相机监控、消费电子以及低功耗IoT智能设备。
两年后的今天,Imagination终于推出了第三代NNA产品4NX。这一系列新品以全新多核架构为特点,每个单核可在不到1瓦的功耗下提供12.5 TOPS 的计算能力,并且可以灵活分配工作负载于不同内核之间,以实现更高效能。
Gilberto Rodriguez表示:“我们的软件提供了精细控制能力,可以将工作负载进行批处理、拆分并调度,从而提高灵活性。在任意数量内核上使用,我们可以配置2个、4个或6个内核集群,每一个8内核集群都能达到100 TOPs。”这样,即使只有6组8核心集群,也能实现600 TOPs 的算力表现。
对于为什么要推出如此高性能的AI加速器,他们解释说:ADAS和自动驾驶需要极高算力,比如L2+级别检测或语音/手势控制需要10 TOPs,而L3-L4级别需求50-100 TOPs,而L5级别需求超过500 TOPs。但是目前市上的AI芯片虽然满足需求,但往往功耗不理想。因此,通过深入了解客户需求,基于前两代低功耗产品,不仅展现了这一系列产品仍然保持其优势,同时也拓宽到了数据中心和桌面级GPU应用场景。
对于如何兼顾600 TPoS 高性能与低功耗的问题,他们提醒称,该技术是在5nm节点实现,因此具有超过30 TPoS/Watt 的性能比,以及超过12 TPoS/mm^2 的密度。同时,还有一种协同机制让用户能够用多个集群实现更大的算力,但这需要在应用层做一些设计调整。而为了降低延迟,他们采用了单独组成2, 4, 6 或者 8 核心的小型集合体,使得所有这些核心可以协作并行处理任务,以此来降低处理延迟,并缩短响应时间。
他们还引入了一种名为Tensor Tiling(TT)的技术,这是一项正在申请专利技术,它利用本地数据依赖性,将中间数据保存在片上存储器中,从而最大限度减少将数据传输至外部存储所需带宽量,比起之前版本减少90%左右。这个技术通过融合更多层次特征图,使得交换过程中的特征图数量减少,从而提升效率和节省带宽。此外,该系统还有一个编译工具链,让开发者能够快速部署功能,而不必手动完成拆分任务。
总之,对于是否会给当前领先于自动驾驶领域的大师Nvidia带来挑战?答案似乎是肯定的,因为尽管Nvidia拥有强大的桌面级GPU背景,但其可能无法适应电池供电车辆对能源效率要求严格的情况。而由于Imagination作为IP供应商,可以与各大厂商合作,不直接生产芯片,因此它有机会打造竞争力的解决方案。此次发布的新款NNA还包含IP安全功能,并符合ISO26262标准,有助于确保车规化产品安全运行。而Andrew Grant透露,此款新品已开始授权销售,并计划2020年底全面投放市场。这无疑是一个值得关注的话题,因为它代表着未来汽车行业的一个重要变革步伐,而且我们很好奇这种变化会如何影响整个产业结构和竞争格局。