在社会的舞台上Imagination性能高达600 TOPS的终极AI加速器如何影响Nvidia同时
在科技的浪潮中,Imagination Technologies以其600 TOPS性能的终极AI加速器掀起了新的风波,这款产品将对Nvidia在自动驾驶领域的领导地位构成挑战。同时,这也让我们不得不关注芯片制造国家排名背后的竞争力与创新能力。
2017年,Imagination推出了首代神经网络加速器(NNA)PowerVR 2NX,其单核性能从1TOPS提升至4.1TOPS。紧随其后的是2018年的PowerVR 3NX,它的单核性能从0.6TOPS增至10TOPS,而多核产品则达到了160TOPS。这些产品最初主要面向移动设备和汽车市场,但随着智能相机监控、消费电子以及低功耗IoT智能设备市场的发展,他们也逐渐拓展到了这些新兴领域。
经过两年的沉淀和研究,Imagination终于发布了第三代NNA产品——IMG Series4。这款全新的多核架构能够提供高达600 TOPS甚至更高的超高性能,使得它成为追求先进驾驶辅助系统(ADAS)和自动驾驶应用的一流选择。
Gilberto Rodriguez,Imagination Technologies产品管理部门总监曾这样表述,“我们的软件提供了精细的控制能力,并通过对多个工作负载进行批处理、拆分和调度而提高了灵活性,可以在任意数量的内核上使用。”这意味着Series4可为每个集群配置2个、4个、6个或者8个内核,一组由8内核组成可以提供100 TOPS算力的解决方案,而配有6组这样的解决方案,则能达到600 TOPS算力。
此外,Series4 NNA在AI推理方面表现出色,比嵌入式GPU快20倍以上,比嵌入式CPU快1000倍。Andrew Grant,Imagination Technologies视觉和人工智能部门高级总监指出:“虽然市场上已经有满足自动驾驶需求的AI芯片,但功耗不够理想。”
为了实现如此高性能,同时兼顾低功耗的问题,Imagination采用了5nm节点技术并且保证超过30 TOPS/Watt 的性能功耗比,以及超过12 TOPS/mm^2 的性能密度。此外,该系列还引入了一种名为Tensor Tiling(ITT)的节省带宽技术,这是一项正在申请专利的事业,也是该系列新增功能之一。这种技术利用本地数据依赖性,将中间数据保存在片上存储器中,从而最大限度减少将数据传输至外部存储器,从而降低带宽使用量到90%左右。
对于开发者来说,由于Tensor Tiling支持批处理和任务拆分,他们可以更加轻松地优化网络结构,以便更好地利用硬件资源。在实际应用中,不仅可以减少延迟,还能有效缩短响应时间。而且由于Tensor Tiling是通过编译器完成,不需要开发者手动调整,因此大大简化了开发过程,并使得工具链更加友好易用。
尽管如此,有观点认为,在这个充满激烈竞争的大环境下,即便拥有如此强大的AI加速器,也难以立即取代如Nvidia这样的行业巨头。不过,如果考虑到电动汽车等移动端市场对功效要求严格的情况下,对于那些寻求既要保持良好的表现又要尽可能节约能源的地方来说,这样的终极AI加速器无疑是一个值得期待之选。不论如何,此次推出的4系列NNA都展示了一种前所未有的可能性,让我们继续关注这一切究竟会如何演变。