数据驱动全球半导体巨擘安谋科技领航端侧AI新纪元
在科技的指引下,端侧大模型从云端的高峰跃至终端的台阶,这一历史性跨越不仅赋予了数据处理以迅捷之翼,更将智能体验推向前所未有的高度。终端上的大模型以灵动姿态,即时捕捉并回应每一个细微需求,将AI触角延伸至世界每个角落。
近日,在EEVIA主办的第12届中国硬科技产业链创新趋势峰会暨百家媒体论坛上,安谋科技产品总监鲍敏祺发表了精彩演讲《端侧AI应用芯机遇,NPU加速终端算力升级》。他深入剖析了端侧AI发展广阔前景,并详细介绍了安谋科技自研NPU最新进展。
AIGC大模型带来的算力提升是端侧AI迎来的最大机遇。鲍敏祺表示,从近期头部大厂发布中都可以看出,端侧AI应用已经得到了业界的一致认可。
当前国际和国内实际部署主流端侧大模型体量主要集中在100亿参数以下。这一限制主要是由于设备内存带宽范围通常在50-100GB/s之间。为了满足用户对应用实时性的需求,10-30亿参数的大模型最适合部署在现有带宽条件下。这些模型能够保持高效性能提供快速响应和高质量服务。
头部终端厂商如OPPO、vivo、小米、荣耀和华为等,都在积极推动 端侧AI发展。不仅自研适合部门署的大模型,还将其与具体业务场景紧密结合。芯片厂商达成了共识认为,神经网络处理单元(NPU)将是未来消费类电子产品发展重点。通过专门优化硬件架构,大幅提升设备计算能力,同时降低功耗。
尽管开发势头强劲,但鲍敏祺强调这并不意味要彻底放弃云段AI相反,他认为两者应该实现互补才能产生最大的收益。在演讲中他特别强调“周易”NPU对异构计算支持,并指出无论从能效还是整个SoC角度来看,异构计算是最佳选择。他解释道面对不同的应用场景,可以实现算力的灵活裁剪,将不必要功耗降到最低。
周易“NPU”已经展示了其性能和灵活性,在多个关键领域,如汽车应用、加速卡以及IoT场景中显示出了它的力量。此外,“周易”NPU能够与不同类型主机处理器进行交互,以及音频图像视频等多种数据形式,使得它能够在复杂环境中保持高性能和灵活性。在IoT场景中,由于面积功耗限制,它仍然能提供有效算力同时保证高度安全性,使其成为理想选择。
最后鲍敏祺表示下一代周易“NPU”将继承并显著增强前代产品特点优势,并围绕精度带宽调度管理及其他方面进行持续优化,以满足当前及未来市场需求。