1nm工艺AI的极限挑战者存储器大哥
在AI的高速发展中,存储器不仅是技术进步的关键,也成为了阻碍AI发展的难题之一。1nm工艺是否已是极限,是许多人关注的话题。然而,这并不意味着我们就要放弃寻求更高效、更节能的存储解决方案。
边缘计算作为新兴市场,其性能提升对存储器设计提出了新的挑战。在不同的应用场景中,我们需要进行复杂的权衡和选择。芯片架构正在不断演化,但数据在芯片、设备以及系统之间如何流动,却仍然是一个未解之谜。
汽车和AI领域中的数据日益丰富且复杂,而芯片架构在处理这些数据时有时候显得手忙脚乱。这给芯片设计人员带来了抉择:是否应该采用共享内存以降低成本,还是增加不同类型内存以提高性能和减少功耗?
所有这些都是基于安全性的前提,并且不同市场对设计要求也各有侧重。例如,在汽车中各种图像传感器(如激光雷达和摄像头)的大量数据需要本地处理。而AI芯片则希望能够实现100倍以上的性能提升。
解决内存问题的一种方法就是将存储器集成到运算单元旁,即所谓的片上存储器。这一方法旨在通过减少负载和数量来突破内存瓶颈,同时降低功耗。
“虽然进行计算于内存在增多,但实际情况似乎大相径庭。”Cadence Digital&Signoff Group高级首席产品经理Dave Pursley表示,“SRAM和DRAM仍然是主流。”
尽管市场出现了新变化,但SRAM与DRAM依旧占据主导地位。专家预测DRAM将会“死亡”,但它却一直保持其经济性、高可靠性与低延迟特点。此外,HBM2等新架构允许通过堆叠模块而不是DIMM来垂直增加密度,使得DRAM更加接近处理单元。
另一方面,SRAM价格昂贵且密度有限,但其高速性能多年来被验证过。在某些情况下,为保证安全性还需增加冗余。这一切都影响了选用哪种类型及数量,以及如何平衡片上与外部记忆体间互连的复杂性。
对于边缘计算来说,对于手机或其他移动设备来说,最重要的是极低功耗。这种需求促使开发者追求更加高效率、适应多种模式工作甚至可以消耗很少能量满足手机或平板电脑等产品需求,当需要时快速切换到更高性能/更高功率模式,从而支持智能手机轻薄化以及消费类设备的大容量配置需求。
然而,开发这样的极低功耗存储器是一项挑战。“当设计这类记忆体时,它们支持广泛速率范围,而且通常比常规记忆体要慢。”Rambus杰出的院士Steven Woo说。“这通常由几个主要应用驱动,所以它必须面向一个非常大的行业才能催生新的记忆体。”
从历史看,手机市场正好是一个成功案例。如果交谈的是不同的手机制造商,他们都会渴望获得更多性能与电源效率兼备的记忆体,以延长电池寿命。这对于其他想要使用同样技术的人来说,将是一个福音,因为他人已经为他们做好了准备工作,只不过他们没有意识到这一点罢了。不过,这样的合格记忆体可能运行于几种不同的速度下,有些甚至接近每秒4.2千兆比特,一些则达到3.2千兆比特,这样做既可以让制造商生产出所谓分级产品,又能满足那些只需便宜价格即可购买较低性能产品用户群的一部分,也就是所谓合格品质量范围之内,就算它们并非全速运行状态,都属于合格品,可以销售给那些不太关心最高速度但是又想节省开支客户群身上的潜在客户,还有一部分可能只是因为缺乏知识而不能理解这些差别,因此这个叫Binning(数据合并)技巧简单来说就是把一些商品按照一定标准分为几组出售,比如最好的那个标价最贵,然后第二好的标价次之,以此类推,每个组里面的商品虽然拥有相同功能,但是由于执行速度或者其他细微差异所以售价略有区别,但是总结起来其实也就那么回事,它们都符合规定标准
关于人工智能发展的问题,无论是在训练过程还是终端推理中,随着空间限制导致无法继续扩展物理硬件的情况下,我们只能依赖改进现有的技术或者探索新的可能性来提升整体表现。而无论何种方式,上述讨论中的GDDR, HBM, SRAM and DRAM 这四大类型都是核心竞争力之一,不仅因为它们提供了必要的手段去控制能源消耗,更因为它们也是当前最佳实践中的代表力量
最后,对于SoC (System on a Chip) 设计师们来说,无论是在什么环境里操作,那么考虑到的总是P.P.A., 也就是Power Performance Area 三者的平衡问题。不管你的目标是什么,不管你处境如何,你始终必须牵涉其中,因为这是决定任何项目成功的一个关键因素:
Power: 电源管理永远是个重要话题。
Performance: 性能永远是驱动创新方向的一个重要指南针。
Area: 面积直接关系到成本,如果面积越小,那么整个系统自然就会越小、越轻盈,而且造价当然会比较适宜。但同时,要注意的是,由于面积缩小带来的热量压力往往变得尤为严峻,因此务必确保系统能够有效散热,以防止过热引起故障。
因此,在未来趋势分析的时候,我们发现随着SoC向更小化发展,其裸露晶圆面积几乎超过50%都是由CPU独占;然后紧接着跟随CPU之后,被称作"海绵"结构,让内部逻辑层层叠加,因而形成一种典型嵌入式结构。而当我们深入了解这个趋势后发现真正影响力巨大的东西竟然来自那被忽视的小伙伴——RAM(Random Access Memory),也就是我们的老朋友— 存储装置!这里面包含很多矛盾,如今人们开始意识到了RAM 的作用其实超出了原先人们设想的地方,它不仅仅提供临时信息缓冲服务,更成为了一份不可或缺的心脏血液,让整个机制运行得顺畅无阻!
现在的问题变成了怎么利用尽可能少资源完成任务?答案显然是不再遵循过去那种粗犷强悍用法,而转向精准、高效、节约能源,与现代社会背景下的科技革新相呼应。当今世界,我相信大家心里都明白,只有持续创新才能帮助人类走出困境找到前行之路!