将革命性的AI芯片引领潮流它不仅能轻松突破冯诺依曼架构的内存墙瓶颈还能让买手机选择变成买天玑还是骁龙
AI芯片革新:存储优先架构将颠覆内存墙困境
在AI技术蓬勃发展的今天,行业巨头们纷纷投入研发,以争夺这场算力与数据处理的未来。然而,尽管算力提升至关重要,但其与内存的不匹配却成为了阻碍AI进步的关键难题。近年,一家成立于2017年的初创公司探境科技提出了以存储为核心的计算架构(SFA),宣称有效解决了这一问题,其背后又是什么故事呢?
【 图片来源:supernovainvest 】
深度学习时代之内存挑战
深度学习算法,如同机器学习领域中的一位高手,不仅需要强大的计算能力,还要求海量数据和高效率的数据交换。这就意味着,无论是CPU、GPU还是FPGA,这些传统芯片类型都面临着如何应对内存瓶颈的问题。而现在,我们看到的是一个新的竞赛——谁能更好地解决这个问题。
【 图片来源:hackernoon 】
冯诺依曼体系结构下的苦恼
现有的冯诺依曼体系结构设计使得处理单元外部获取和写回信息成为必要。但当运算能力超越了可用的数据容量时,即便增加更多运算资源也无济于事。这正是目前许多人工智能应用所面临的问题——即使拥有强大的计算能力,如果无法有效利用大量数据,那么所有努力都可能付诸东流。
【 图片来源:nextplatform 】
四种尝试突破内存壁垒但未成功的情况分析
加大外部带宽:通过采用HBM2等高带宽外部存储来降低对DDR访问速度。
集成分布式片上缓存:直接在芯片内部放置大量SRAM以减少对DDR依赖。
算法调整优化:通过设计低比特权重神经网络简化需求和管理。
存储与计算一体化(In Memory Computing):在单个记忆体中实现简单并行指令执行。
每一种方法似乎都有其优势,但它们各自存在局限性,比如成本高昂、精度牺牲或过分复杂。显然,当前市场上普遍采用的基于类CPU架构的方案虽然提升了并行性,却无法真正解决内存壁垒问题。
SFA架构——探径科技打破传统束缚?
北京探径科技CEO鲁勇曾表示,他们团队成员平均拥有15年以上芯片行业设计经验,并且具备深挖问题核心本质思维,因此他们坚定地追求难题解决。在这种背景下,他们开发了一种名为SFA(Storage First Architecture)的全新架构,该架构将“先有数据,然后再把算子交给它”,彻底颠覆了传统处理方式。
【图片来源:nextplatform】
SFA优势多端展开:
巨大PPA突破 —— 实验表明,与基于总线和指令集映射方法相比,可降低10~100倍的数据访问时间;28nm工艺条件下系统能效比达到4T OPS/W,计算资源利用率超过80%,DDR带宽占用率降低5倍。
通用型支持 —— 能够支持任意神经网络模型,无论大小、类型或精度;既可以用于本地推理,也可以用于云端训练及终端推理加训练模式。
灵活性 —— 可根据最终产品定位进行选择;同时,它还能够适应多精度计算以及自适应稀疏化处理,不需要离线剪枝或压缩过程。
此外,由于独特无MAC设计方式,探径科技提供了一种更加节能、高效的人工智能硬件解决方案,使得其在安防监控、工业制造、自动驾驶及语音人机交互等关键领域具有显著落地优势。此举不仅展示了该公司对于未来的洞察力,更是在技术创新方面迈出了一大步,为整个AI产业注入新的活力。