华为麒麟9010芯片官宣社会期待其对Nvidia终极AI加速器600 TOPS挑战力的提升
。Imagination Technologies,曾经在手机GPU IP市场和汽车GPU IP市占率上占据领先地位,现在面临着新的挑战。近期,Imagination发布了耗时两年研发的最新神经网络加速器(NNA)产品IMG Series4,其全新的多核架构可提供600 TOPS甚至更高的超高性能,主要面向先进驾驶辅助系统(ADAS)和自动驾驶应用。
以低功耗产品见长的Imagination推出高性能的终极AI加速器,这将给在自动驾驶汽车芯片市场领导地位的Nvidia带来巨大的压力?Nvidia自2015年以来一直是车载计算平台的领导者,但对于电池供电的电动汽车来说,它们可能无法满足功耗要求,这正是Imagination优势所在。
耗时两年的打造中,Imagination Technologies AI火热2017年推出了首代神经网络加速器(NNA)PowerVR 2NX,从1TOPS到4.1TOPS。紧接着2018年PowerVR 3NX发布,从0.6TOPS到10TOPS,多核产品性能从20TOPS到160TOPS。这次新一代产品强调的是全新多核架构,这个新的多核架构支持在多个内核之间对工作负载进行灵活分配和同步,从而实现更高性能。
Gilberto Rodriguez介绍,“我们的软件提供了精细控制能力,并通过对多个工作负载进行批处理、拆分和调度提高灵活性,可以在任意数量内核上使用。”Series4可为每个集群配置2、4、6或8个内核,一组8内核可以提供100 TOPS算力,而配有6组8内核解决方案就可以提供600 TOPS算力。
针对AI推理方面,该系列比嵌入式GPU快20倍以上,比嵌入式CPU快1000倍。在ADAS和自动驾驶需求中,与L2+驱动员检测或语音/手势控制需要10 TOPS性能;L3-L4级别自动驾驶50-100 TOPS;L5级别500+.TOPs.
Andrew Grant表示:“虽然市场上已经有满足自动驾驶需求的AI芯片,但功耗不够理想。所以,我们花两年时间去了解客户需求,将基于我们的前两代低功耗产品,推出了高性能低功耗的4NX系列产品。”
如何兼顾如此高性能与低功消?需要指出的是,该系列要实现100 TOPS单独一个集群超过30 TP/Watt 的效能比,以及超过12 TP/mm^2 的密度是要在5nm节点实现。此外,对于延迟降低采用的方法是在单核心中形成两个或者更多核心的小型集群,使得所有核心能够协作并行处理任务,同时降低处理延迻缩短响应时间。而且不同核心独立运行也成为该技术亮点之一。
此外,该技术还采用了一种名为Tensor Tiling技术,这是一种正在申请专利技术也是该系列新增功能。这种方式利用本地数据依赖性将中间数据保存于片上存储器中,以减少将数据传输至外部存储设备所需带宽,即使达到90%左右带宽节省效果。
总之,此次发布不仅展现了科技实力的同时,也让同行业增加关注。此举是否能有效威胁当前领先位置上的Nvidia,在未来的竞争场景下我们才能明确答案。但无疑这是一个值得关注的问题,因为它涉及到了科技界未来发展趋势以及消费者选择与接受程度的问题。