qq最新资讯超越语言边界的机器学习探秘得益于非语义特征技术达人北交桑基韬揭示了这项前沿技术的双刃剑效
在AI技术的快速发展中,北交桑基韬教授深入探讨了机器学习领域的关键挑战之一——不可信赖性。尽管当前的人工智能算法能够在实验室环境下实现或超越人类水平,但它们在实际应用中的可靠性和稳定性仍然是一个未解决的问题。
4月8日,在AI TIME青年科学家——AI 2000学者专场论坛上,北交桑基韬教授发表了一篇名为《"超"人的机器学习:非语义特征的得与失》的报告。在这次演讲中,他从两种虚假相关性的角度阐释了这种现象:
首先是欠蒸馏,即模型只学习到了训练数据的局部相关性,导致分布外泛化和公平性问题。其次是过蒸馏,即模型学习到了人难以感知或理解的模式,这会影响到模型对抗鲁棒性的问题。
为了解决这些问题,桑基韦教授提出了将虚假相关性的统一,以及探索非语义特征的学习和利用。这不仅仅是一项理论上的研究,而是在实践中也展现出巨大的潜力。
他通过多媒体分析特别是计算机视觉领域中的非语义特征现象进行了分解,并指出这些特征既有益也有弊。他展示了如何通过对抗噪声来体现人与AI算法之间不同之处,以及如何利用形状、纹理等信息来增强模型性能。
此外,他还讨论了频域中的高频重建图像,可以准确预测类别,但对于人类来说几乎无法识别。这表明数据包含两类信息:一种是语义信息,一种是以高频为代表的非语义信息。人类只能依赖于语义信息进行判断,而模型可以同时利用这两部分信息。
总结来说,这些非语义特征不仅帮助机器超越人类,而且也是当前许多机器学习任务超过人类的一个原因。但同样地,它们也带来了新的挑战,比如分布外泛化、公平性以及对抗鲁棒性的问题。因此,我们需要进一步研究如何有效地利用这些特征,同时减少它们带来的风险。