深圳芯片巨擘前十名安谋科技周易NPU引领端侧AI新纪元
在科技的光芒照耀下,一个巨大的模型从云端的殿堂飞跃到了终端的舞台。这场历史性的迈步,不仅赋予了数据处理以迅捷的翅膀,也将智能体验推向前所未有的高度。终端上的大模型以灵动的姿态,实时捕捉并回应着每一个细微的需求,将AI触角延伸至世界每个角落。
近日,在EEVIA举办的第12届中国硬科技产业链创新趋势峰会暨百家媒体论坛上,安谋科技产品总监鲍敏祺发表了主题演讲《端侧AI应用芯机遇,NPU加速终端算力升级》。他深入剖析了端侧AI发展广阔前景,并详细介绍了安谋科技自研NPU最新进展。
鲍敏祺指出,从近期头部大厂发布中都可以看出,端侧AI应用已得到了业界一致认可。当前国际国内实际部署主流端侧大模型体量集中在100亿参数以下,这主要是由于设备内存带宽范围通常在50-100GB/s之间。他认为10-30亿参数的大模型最适合现有带宽条件下的快速响应和高质量服务提供。
头部终端厂商如OPPO、vivo、小米、荣耀和华为等,都在积极推动端侧AI发展,他们不仅自研适合部署的大模型,还将其与具体业务场景紧密结合。芯片厂商达成了共识,将AI NPU视为未来消费类电子产品发展重点。NPU通过专门优化硬件架构,大幅提升设备AI计算能力,同时降低功耗。
尽管开发势头强劲,但鲍敏祺强调这并不意味着要放弃云端AI相反,他认为两者应该实现互补,以产生最大收益。他解释道,两者的优势各异:首先,在于时效性和数据本地化带来的安全性;其次,在于更复杂任务处理能力。此外,他还提出了多模态场景,即图像、音频、视频等多种输入方式组合,使设备全面理解用户需求,并预测满足用户期望,从而实现真正智能化。
面对成本、功耗和生态系统挑战,“周易”NPU围绕微架构、高效能以及并行处理进行三重升级。
· 微架构:针对Transformer优化,让“周易”NPU克服实际计算瓶颈。
· 效率:混合精度量化,如int4和fp16,以及无损压缩稀疏度增加有效带宽。
· 并行处理:采用数据或模型并行减少搬运工作。
鲍敏祺还介绍了下一代“周易”NPU架构,对于多任务支持具备Task Schedule Manager,而且具有扩展能力,并增加DRAM匹配及OCM支持特殊算法要求。
最后,他特别强调“周易”NPU对异构计算支持,无论从能效还是SoC面积来看,是最佳选择。他解释道,为不同的应用裁剪算力,可以降低不必要功耗。在汽车应用、中加速卡及AIoT等领域,“周易”显示性能与灵活性,以及成功定点应用于吉利领克车型中证明其价值。