震撼人心全新AI芯片即将揭开帷幕打破冯诺依曼架构的内存墙瓶颈其芯片内部结构图无疑是科技奇迹让市场预计
近年来,AI热潮再次兴起,不仅引发了芯片巨头们的AI芯片战,更让科技巨头们纷纷开始了AI芯片的研发。在这场争夺中,算力首先成为了焦点。不过,算力提升之后,算力与内存的不匹配又成为了阻碍AI向前发展的关键。此时,一家成立于2017年的初创公司提出的存储优先架构(SFA)表示很好地解决了内存墙的问题,但事实是否如此?
【 图片来源:supernovainvest 】
AI芯片真正的问题在于内存墙
算力、算法、数据被认为是AI向前发展的三个关键因素,更高的算力自然必不可少,这也直接驱动了AI芯片公司们推出更高算力的AI芯片。不过,对于这一轮的人工智能热潮,我们需要指出,它很大程度上是机器学习尤其是深度学习受到了追捧。
由于目前常见的芯片类型CPU、GPU、FPGA、ASIC都可以运行深度学习算法,因此这些芯片都可以称为AI芯片。CPU、GPU、FPGA和ASIC各自有不同的特点,如下所示:
【 图像来源:hackernoon】
这就意味着,如今对于我们来说,重要的是满足机器学习需求。但即便是经验丰富的大Arm,也认识到这个问题走了一些弯路。Arm机器学习部门商业与市场副总裁Dennis Laudick此前接受雷锋网采访时,就表示:“我们第一次看到机器学习时,我们首先想到的是从已有的处理器类型中的一种开始,因此我们开始用了GPU,但最终发现机器学习处理器面临的是数据问题,最终取消了GPU方法,并创建了一个专注于数据以及在神经网络中的数据类型,可以执行并行指令。”
说得更直白一些,是不是深度学习具有高并发、高耦合特点?不仅有大量数据参与到整个过程中,这些数据之间也非常紧密,因此对带宽提出了非常高要求,大规模交换特别是在核心部件与外部DDR(Double Data Rate SDRAM, 双倍速率同步动态随机访问记忆体)的交换,将大幅增加功耗。
越来越多的人工智能领域IP提供者和设计者意识到,即使要解决计算问题,也要解决更多与数据和存储相关的问题。因此,与“三高”特性有关的一般而言,“四种常见解锁方法”似乎还不足以解决这一挑战。
加强外部缓冲区带宽,以减少DDR访问延迟。
直接集成大量SRAM至每个核心,从而减少DDR访问次数。
通过降低模型精度或使用二值神经网络等方式简化模型大小。
在存储单元内部设计计算单元进行“一体化”,如In-Memory Computing。
显然,这些方法尚未成功,因为绝大部分当前可用的人工智能设备,都基于类似传统CPU体系结构,其中专注于整合计算能力,并通过提升并行性的方法进行庞大的计算力的调整,而对资源利用和调度仍然依赖编译器或传统缓冲管理策略,所以无法有效应对内存限制。
SFA架构如何突破这些难题?
舍弃冯诺依曼架构,无疑是一个更好的方向,但是它也是一个极其困难的事情。不过,在2017年成立的一个初创公司北京探境科技有限公司却重新思考过现有的技术关系,以存储为中心去设计它们——SFA(Storage First Architecture)。
CEO鲁勇介绍说:“主要原因包括两方面。一方面,我们团队成员平均拥有15年以上硬件设计经验,有足够能力,同时我们的团队成员也有挖掘根本本质思维习惯,所以从能力上和做事方式上都有这样的条件。”他坚定地决定去解决这些难题。
不同于其他方案尝试加强内层缓冲区带宽或者集成更多SRAM到每个核心或者采用简单模型或者在物理单元里加入新的功能以实现一体化计算系统;SFA系统则以优化之为核心,将所有运作发生在移动过程中完成。这意味着,在移动过程中完成所有必要操作,而不是等待后续步骤完成后才行动起来。这是一种完全相反逻辑的情况:通常情况下你会收集你的信息,然后按照你的指令进行操作;但这里,你只需提供你想转移给另一个人信息,他们就会自动知道他们应该如何处理它们。这样做不会因为任何错误导致意料之外的事物发生,因为一切都是根据预设规则发生。而且,由于是关于纯粹数学上的运作,所以效率极高,而且能节省能源浪费。
当然,要实现这种非凡改变并不容易。在接受媒体采访时,他透露称涉及许多硬件基础知识,以及复杂且微妙的心智控制系统,以及节点间灵活连接—all of which are extremely difficult to solve problems.
然而,他进一步解释道:
"我们的图形计算平台基础建立了一套精巧且针对性的解决方案,为那些过去无法被同一套工具轻易涵盖的问题提供了解决方案—这是由Lecun先生所阐述的人工神经网络全部都是图形分析问题论述."
因此,当Rudong谈及未来潜力的可能性时,他认为他的产品已经能够支持几乎所有形式的小型、中型甚至大型神经网络,不管它们是什么精确级别。他同时强调他的产品适用于各种环境,从云端服务一直到个人应用设备。最后,他承认虽然他制定的计划可能会面临某些挑战,但他相信他们已经准备好了应付任何事情,并希望未来能继续保持竞争优势。他进一步说明:
"我们的技术创新包含多项独特优势,比如无MAC设计方式..."
尽管存在一些挑战,但是当人们考虑将这个特殊概念扩展至安防监控工业制造自动驾驶语音交互领域,那么实际落地优势变得更加明显。他表示:"看似差异挺大的几个行业其实很多共通性...".