阿里云发布CIPU云计算新阶段人物深入芯片结构探索
阿里云智能总裁张建锋在峰会上正式发布CIPU(Cloud infrastructure Processing Units),即云基础设施处理器。这是一颗云端处理器,用于连接服务器内部硬件和部署在云上的虚拟化资源。在过去十多年间,云计算技术发展经历了分布式技术和资源池化技术两次革新:分布式和虚拟化技术代替了大型机,满足了当时企业所需的算力规模。而资源池化技术通过计算存储分离架构,将计算、存储、网络资源分别池化,则为数据中心提供超大规模的云计算服务打下了基础。但随着数据中心的发展,客户的需求也在发生新的变化。随着数据密集型计算场景的普及,用户对低时延、高带宽的需求也越来越高,传统以CPU为中心的计算体系架构无法适应这一趋势。
近年来被业界广泛提及的DPU(Data Processing Unit)应运而生,能够为CPU分担一部分工作,使CPU能够专注于更重要的计算中,提升数据中心的效率。阿里本次发布的CIPU作用与DPU无异。从产品命名的角度,上述CIPU与英特尔去年发布的一种类似产品——IPU(Infrastructure Processing Unit)更类似。英特尔公司数据平台事业部首席技术官Guido Appenzeller认为,“DPU和IPU在功能上没有根本性差别,只是命名不同。”他还指出,即使加入了IPU后的架构可以清晰地区分租户区和云服务提供商区,可以把基础设施功能转移到专门优化的小芯片上,从而实现性能的大幅提升,并且将数据中心变成了无磁盘架构,不需要再给每台服务器配备磁盘。
值得注意的是,与第三方提供商提供的大多数DPU/IPU不同,这款自研芯片不仅具有软件定义和模块加速功能,更为重要的是,它能与阿里巴巴集团旗下的飞天系统更紧密地结合,以搭建一套完整的地理分布式 云体系结构。此外,由于其设计目标是为了支持飞天系统,因此它尤其针对此系统进行优化,以实现最佳性能。此举标志着阿里正在迈向一个全新的阶段,其自研芯片将成为未来cloud computing领域不可或缺的一环。
据了解,此项研究始于2015年,当时开始进行深入研究并最终推出了“神龙”系列服务器,这些服务器具有零损耗虚拟化能力。在接下来几年的时间内,该团队不断创新,最终演进出现在我们面前的这种基于CIPUs核心组成元素之所以重要,是因为它们允许企业更加灵活地调整他们的事务负载,从而提高整体效率,并减少因过度使用某个单一类型设备导致的问题。
总结来说,在这个全新架构中,每个组件都被设计用作独立运行,而不是作为一个巨大的单体单位操作。这意味着,如果某个部分出现故障,那么其他部分仍然可以继续运行,同时降低整个系统崩溃风险。此外,还有一个潜力的好处是这些改进可能会帮助企业节省成本,因为它们不必购买那么多昂贵且复杂的大型硬件设备来满足日益增长的事务负载。