数字芯片时代安谋科技周易NPU引领端侧AI革新改变人物生活方式
在科技的光芒照耀下,一个巨大的模型从云端的殿堂飞跃到了终端的舞台。这场历史性的迈步,不仅赋予了数据处理以迅捷的翅膀,也将智能体验推向前所未有的高度。终端上的大模型以灵动的姿态,随时捕捉并回应着每一个细微的需求,将AI触角延伸至世界每个角落。
近日,在EEVIA主办的第12届中国硬科技产业链创新趋势峰会暨百家媒体论坛上,安谋科技产品总监鲍敏祺发表了精彩演讲《端侧AI应用芯机遇,NPU加速终端算力升级》。他深入剖析了端侧AI发展广阔前景,并详细介绍了安谋科技自研NPU最新进展。
AIGC大模型带来的算力提升,是端侧AI迎来最大机遇。鲍敏祺表示,从近期头部大厂发布中都可以看出,端侧AI应用已经得到了业界的一致认可。
当前国际和国内实际部署主流端侧大模型体量主要集中在100亿参数以下。这一限制主要是由于设备内存带宽范围通常在50-100GB/s之间。为了满足用户对应用实时性的需求,大型企业如OPPO、vivo、小米、荣耀和华为等,都在积极推动这种技术发展,他们不仅自研适合部署的大型模型,还将其与具体业务场景紧密结合。
尽管开发此类技术面临成本、功耗和生态系统三重挑战,但安谋科技自研“周易”NPU围绕微架构、能效和并行处理等方面进行了三重升级:
· 微架构:针对Transformer优化,以克服实际计算中的瓶颈。
· 效率:通过混合精度量化,如int4和fp16,以及无损压缩和改变稀疏度增加有效带宽。
· 并行处理:采用数据或模型并行减少数据搬运负载均衡Tiling策略。
鲍敏祺还展示了一代“周易”NPU未来版本,它包含能够适应多任务场景Task Schedule Manager,并具有可扩展能力增添DRAM实现高带宽匹配以及OCM支持特殊要求算法。此外,他强调异构计算对于能效及SoC面积角度都是最佳选择,因为它能够根据不同的应用裁剪算力降低不必要功耗。
周易“NPU”已被用于汽车应用、高性能加速卡以及多种复杂AIoT环境中,其灵活性使之成为各种关键领域理想选择。在汽车领域,“周易”NPU能够根据不同需求裁剪出所需算力;在加速卡中,它与不同类型主机交互,可以处理音频图像视频多种形式;而在IoT环境中,它提供高效且安全的支持,使之成为市场上的首选产品之一。
最后鲍敏祺表示,一代“周易”NPU将继承并显著增强现有优势,并持续优化精度、带宽调度管理以及操作员支持,同时确保适配当前及未来存储介质,为市场提供更全面的解决方案。