小米芯片引领端侧AI新时代安谋科技周易NPU智能无处不在
在科技的光芒照耀下,一个巨大的模型从云端的殿堂飞跃到了终端的舞台。这一历史性的转变,不仅赋予了数据处理以迅猛之翼,更将智能体验推向前所未有的高度。终端上的大模型以灵活的姿态,及时捕捉并回应着每一个细微的需求,将AI触角延伸至世界每一个角落。
近日,在EEVIA主办的第12届中国硬科技产业链创新趋势峰会暨百家媒体论坛上,安谋科技产品总监鲍敏祺发表了精彩演讲《端侧AI应用芯机遇,NPU加速终端算力升级》。他深入分析了端侧AI发展广阔前景,并详细介绍了安谋科技自研NPU最新进展。
鲍敏祺指出,从近期头部大厂发布中都可以看出,端侧AI应用已经得到了业界的一致认可。当前国际和国内实际部署主流端侧大模型体量主要集中在100亿参数以下,这是由于设备内存带宽范围通常在50-100GB/s之间,以10-30亿参数的大模型最适合现有带宽条件下的实时性需求,同时提供高效性能和快速响应服务。
头部终端厂商如小米等,都在积极推动端侧AI发展,他们不仅自研适合部署的大模型,还将其与具体业务场景紧密结合。芯片厂商达成了共识,将AI NPU视为未来消费类电子产品发展重点。NPU通过专门优化硬件架构,大幅提升设备AI计算能力,同时降低功耗。
尽管开发者们对接口、软件生态系统以及数据安全等方面提出了挑战,但安谋科技“周易”NPU围绕微架构、能效和并行处理进行三重升级:
微架构:针对Transformer进行优化克服实际计算瓶颈。
效率:混合精度量化实现低精度操作,加强无损压缩和改变稀疏度。
并行处理:采用数据或模型并行减少数据搬运。
鲍敏祺还介绍了下一代周易“NPU”架构,不仅包含多任务支持,而且具备可扩展性,并增加DRAM匹配高带宽,以及OCM支持特殊算法要求。他特别强调异构计算对于能效和SoC面积角度下的最佳选择,为不同应用场景灵活裁剪算力并降低不必要功耗。
周易“NPU”已在汽车、加速卡以及多种复杂环境中展示其性能和灵活性,如吉利旗下的领克系列车型中成功定点应用,其累计出货超过40万片。此外,它能够与不同类型主机交互、高效处理音频、图像视频等多种形式,使其成为复杂环境中的理想选择。在面对面积和功耗严格限制的情况下,它仍然提供高效算力同时保证高度安全性,是众多应用场景理想选项之一。