半导体界的革命将至一款能彻底摒弃冯诺依曼架构限制轻松突破内存墙瓶颈的AI芯片即将震撼市场改变集成电路
半导体行业的革命将至!一款能彻底摒弃冯诺依曼架构限制,轻松突破内存墙瓶颈的AI芯片即将震撼市场,改变集成电路历史的发展轨迹!
近年来,AI热潮再次燃烧,如同火山爆发般席卷全球。科技巨头们纷纷投身AI芯片研发之中,而算力成为争夺焦点。不过,这场算力的提升之后,却又遇到了新的障碍——内存与算力的不匹配,这正是阻碍AI前进的关键。
在此背景下,一家成立于2017年的初创公司提出了存储优先架构(SFA),宣称有效解决了内存墙的问题,但事实是否如此?
【 图片来源:supernovainvest 】
AI芯片真正的问题是内存墙
算力、算法、数据被认为是AI向前发展的三个关键因素,更高的算力自然必不可少,这也直接驱动了AI芯片公司推出更高算力的AI芯片。不过,对于这轮风潮,我们必须指出,它很大程度上是机器学习尤其是深度学习受到了追捧。由于目前常见的芯片类型CPU、GPU、FPGA、ASIC都可以运行深度学习算法,因此这些芯片都可以称为AI芯片。
【 图片来源:hackernoon 】
CPU、GPU、FPGA、ASIC特点
这意味着如今,重要的是满足机器学习需求。但即便经验丰富的Arm,也走了一些弯路。Arm机器学习部门商业与市场副总裁Dennis Laudick曾表示:“我们第一次看到机器学习时,首先想到的是从已有的处理器类型中的一种开始,因此我们开始用了GPU方法,但最终发现面临的是数据问题,最终取消了GPU方法。”
【 图片来源:nextplatform 】
深度学习“三高”特点
内存墙问题4种常见解决方法
为了解决这一问题,我们有四种常见但尚未成功实现的大致方案。一种是在外部增加更多带宽,比如HBM2;一种是在晶体管内部放置大量SRAM;另一种则通过设计低比特权重神经网络简化数据管理;最后一种在单元内部设计计算单元进行存储计算整合(In Memory Computing)。
显然,现在所有这些方案都还未能完全解决这个难题,其中一个原因在于绝大部分当前存在或正在开发的人工智能处理系统基于类似CPU架构,不仅专注于计算整合,而且通过提升并行性来调整结构,以应对庞大的计算任务,但它们依旧无法有效利用和调度资源。
SFA如何突破内存墙?
舍弃传统冯诺依曼体系结构,无疑是一个更好的方式,不过它也极具挑战性。北京探境科技CEO鲁勇解释说,他们团队成员平均拥有15年以上经验,有足够能力去解决核心本质问题,从而能够坚定地去攻克难题。
探境科技CEO鲁勇展示SFA架构
不同于其他尝试过以往方法而失败的地方,SFA以数据调度为核心,将计算过程融入到数据搬移过程中,使得每一次数据移动都会引起相应操作。这与传统模型不同,即由指令决定何时、何处使用哪些数据,而不是让不同的操作节点灵活地根据需要连接起来进行处理。
虽然这样的新架构方式面临许多挑战,但据说它已经取得了巨大的PPA突破。在实验条件下,可以减少10到100倍之多的地访问时间,并且具有超过80% 的资源利用率和5倍DDR带宽占用率降低。此外,该架构支持任意神经网络,可适用于各种大小和精度,不仅限于浮点型,还包括定点型,以及可支持混合精度运作。而且,由于是通用的框架,可以应用在任何需要推理或训练的地方,只要在神经网络深度学习框架下工作,都能提供相同级别服务。
除了性能优势,其独特无MAC设计方式也使其备受瞩目。而对于安防监控、高级制造业自动驾驶以及语音交互等领域,其潜在落地优势仍然明显,因为该技术既适用于本地设备,又可扩展至云端环境,是未来人工智能领域不可忽视的一环。