在目前中国芯片技术的辉煌舞台上阿里含光800 AI处理器如同一位高超技艺的艺术家以其卓越的性能轻松超
在阿里巴巴集团首席技术官兼阿里云智能总裁张建锋于2019年杭州云栖大会上隆重发布其自研AI芯片含光800后,该芯片就像一道亮丽的风景,吸引了无数人的目光。经过一年多的发展和完善,此前未对外发售的含光800现已正式对外服务,其NPU实例可以直接购买,不需要白名单限制。
龙欣,阿里云异构计算产品研发总监,在今年的线上云栖论坛中详细介绍了含光800近一年来的最新进展。他指出,含光800主要面向数据中心中的CNN类型模型推理加速,适用于城市大脑、图像视频审核以及拍立淘等业务。此外,由于内部AI需求强烈,包括电商应用、视觉应用、语音交互和自然语言理解等领域,对于提升效率和性价比有着重要意义。
包含深度优化CNN及视觉类算法、高能效低延时、高密度计算与存储以及软硬协同支持权重稀疏压缩等特点,含光800不仅针对CNN算法进行设计,还保持一定灵活性,以便在特定应用和算法中实现高性价比。据去年发布时所提供数据,在ResNet-50测试中,与目前业界最好的AI芯片相比性能提升4倍,而能效比则是第二名的3.3倍。
尽管龙欣在分享中并未提及含光800峰值性能,但他强调了其可用性,并表示通过阿里云输出。为了让用户能够快速使用该芯片,系统支持公共镜像CentOS 7.6/7.7和Ubuntu 16.04,同时预装主流深度学习框架,如TensorFlow、MXNet,并提供示范教程。
至今为止,在三大核心场景中,比如行人检测、车辆检测以及内容识别应用中的ResNet50 V2模型等,其中涉及到的性能提升分别达到了4-11倍。在直播视频增强方面,可达到500 FPS,比主流推理GPU快10倍;而在点播HDR方面,则具有66 FPS表现,这使得其性能加速比达到了10倍甚至更高。
尽管此次分享给出的信息可能并不全面,但我们可以看出,即便是拥有强大团队迅速设计新一代芯片的大型企业,也需要时间来确保这些创新能够广泛落地并获得市场认可。而对于未来是否会推出下一代AI芯片,以及何时推出,这仍然是一个未知之数。