最新游戏资讯超越语言边界的机器学习奇迹与挑战
在AI技术的快速发展中,北交桑基韬教授深入探讨了机器学习领域的关键挑战与机遇。4月8日,他在AI TIME青年科学家——AI 2000学者专场论坛上发表报告《“超”人的机器学习:非语义特征的得与失》,揭示了不可信赖性的主要原因以及如何通过深度学习实现人类水平的性能,同时也指出了对抗鲁棒性、解释性和公平性的不足。
北交桑基韬教授首先强调,机器学习即使是以人为基础,也会出现两种虚假相关性:欠蒸馏和过蒸馏。欠蒸馎意味着模型只学会了局部相关性,而过蒸馎则导致模型捕捉到了难以理解或感知的人类模式,这些都影响了模型的泛化能力和解释性。
为了解决这些问题,桑基韬教授提出了一个全新的观点,将虚假相关性统一,并探索非语义特征的学习与应用。他认为非语义特征不仅存在于图像分类中,而且还广泛存在于计算视觉、自然语言处理等多个领域。这些特征虽然对人类来说不可见或难以理解,但对于提升模型性能至关重要,如AlphaFold蛋白质结构预测系统所展示的一样。
然而,这些非语义特征同样带来了一系列挑战,比如它们可能成为攻击目标,对抗噪声可以被用来欺骗神经网络,使其产生错误输出。此外,不同的人工智能算法对于不同类型数据有不同的表现,有些算法可能更擅长利用纹理信息,而有些则更依赖形状信息。
通过对比人类视觉系统和CNN模型处理缺失形状信息时的情景,我们发现人脑需要借助形状信息进行判断,而CNN却能准确地基于纹理进行分类。这提示我们,数据不仅包含可见层面的语义信息,还隐藏着高频部分代表的非语义信息。在未来的研究中,我们将更加关注如何有效地利用这些非语节特征,以构建更加强大的人工智能系统,同时也要解决它们带来的潜在风险和挑战。