中国芯片制造水平现状Nvidia终极AI加速器面临的挑战者如何影响社会
中国芯片制造水平现状:Nvidia终极AI加速器面临的挑战者如何影响社会?
在中国,随着技术的快速发展,芯片制造水平也在不断提升。Imagination Technologies,这家曾经统治手机GPU IP市场的公司,在移动GPU IP市场占有率高达36%,而在汽车GPU IP市占率更是达到43%。近期,Imagination推出了全新的第三代神经网络加速器(NNA)产品IMG Series4,其全新的多核架构可提供600 TOPS(每秒万亿次操作)甚至更高的超高性能,主要面向先进驾驶辅助系统(ADAS)和自动驾驶应用。
这款终极AI加速器耗时两年研发,不仅展现了Imagination强大的实力,也让同行们增加对这位老对手的关注。它以低功耗产品见长,但其高性能又能给在自动驾驶汽车芯片市场占有领导地位的Nvidia带来多大的冲击?
为了回答这个问题,我们需要了解一下Imagination如何通过其新一代产品4NX系列实现600TOPS的性能,同时兼顾低功耗,以及这种技术如何影响社会。
4NX系列采用全新多核架构,每个单核可以以不到1瓦的功耗提供12.5TOPS性能。这意味着一个8内核集群可以提供100TOPS算力,而配有6个8内核集群就可以提供600 TOPS算力。在AI推理方面,该产品比嵌入式GPU快20倍以上,比嵌入式CPU快1000倍。
至于为什么要推出如此高性能且低功耗的AI加速器,Gilberto Rodriguez表示,“ADAS和自动驾驶对芯片有很高的算力需求,比如L2+ 的驾驶员检测或语音/手势控制需要10TOPS 的性能,而L3-L4级别 的自动驾驶则需要50-100TOPS 的性能。”
虽然市场上已经有满足自动驾驶需求的大型数据中心级AI处理单元,但这些设备通常不适合电动汽车使用,因为它们具有较大体积、较大能源消耗以及过热的问题。而现在,由于电动车和智能交通系统越来越普及,对于小型、高效能、低功率消耗的人工智能处理单元需求日益增长。
然而,为实现这样的目标并非易事。Gilberto Rodriguez指出,“如果要用多个集群实现更高算力,我们可以提供多集群协同机制,但也需要客户在应用层进行一些设计。” 这表明尽管四方X拥有非常灵活且强大的多核心架构,它仍然依赖于客户端软件开发者的努力,以最大化该硬件能力。
对于延迟降低,这款新技术采用了独特的手段——所有内核都能够相互协作,并行处理一个任务,从而降低处理延迟。此外,还有一种叫做“Tensor Tiling”的技术,它利用本地存储空间将中间数据保存,从而减少大量传输到外部存储设备所需带宽,大幅度提高效率与节省能源。
总之,这款终极AI加速器不仅为电子消费品行业带来了新的可能性,而且为那些追求安全性和可靠性的企业解决方案打下坚实基础。在未来的几个月里,我们将看到更多关于这一革命性的科技及其潜力的讨论,以及它如何改变我们的生活方式。