NBA最新资讯超越人类的机器学习秘密 - 探索非语义特征的双刃剑
在AI技术的快速发展中,北交桑基韬教授深入探讨了机器学习领域的关键挑战之一——不可信赖性。尽管当前的人工智能算法能够在实验室环境下实现甚至超越人类的表现,但它们在实际应用中的可靠性和鲁棒性仍然是一个重大问题。
4月8日,在AI TIME青年科学家——AI 2000学者专场论坛上,北交桑基韬教授发表了题为《“超”人的机器学习:非语义特征的得与失》的报告。在这次讲座中,他从两类虚假相关性的角度阐释了这一现象。他提出了“知识蒸馏”的概念,即机器学习通过模仿人类知识来进行训练,这种过程可能会出现欠蒸馏(虚假相关性-1)和过蒸馎(虚假相关性-2)的情况。
欠蒸馏发生在数据不够充分时,模型仅仅学习到了训练数据局部相关性的模式,从而导致分布外泛化问题,而过蒸馎则是机器学习到了人难以理解或感知到的模式,这影响了模型的对抗鲁棒性和解释能力。桑基韬教授还提出了一种方法,将这些虚假相关性的统一,并探索非语义特征的学习与利用。
此外,他指出,对抗攻击对于检测模型脆弱性的重要意义,以及如何通过增加噪声来揭示模型对抗样本识别能力的问题。此外,他还分析了高频信息对于CNN模型判断物体形状和纹理至关重要的事实,以及频域内存在两类信息——语义信息与非语义信息之间微妙关系。
最后,桑基韬教授强调,非语义特征并不一定是过拟合噪声,它可以跨越不同模型和数据集,使其具有迁移性能。这有助于我们更好地理解这些特征对于某些任务有效果以及它如何帮助我们的AI系统超越人类水平。