后方格智能化观察网
首页 > 机器人 > 揭秘旅游新趋势单靠分布偏移远不够真实数据背后的外部有效性之谜等待解答

揭秘旅游新趋势单靠分布偏移远不够真实数据背后的外部有效性之谜等待解答

揭秘最新旅游趋势:单靠分布偏移远不够!真实数据背后的外部有效性之谜等待解答

在探索人工智能技术的应用领域,特别是其中的可信人工智能系统中,研究者们一直关注于一个关键问题——数据分布偏移。然而,纽约大学AI Now研究所的技术研究员Deborah Raji提出了一个深刻的问题:仅仅关注数据分布偏移是否足够?她认为,更重要的是要考虑到外部有效性的概念。

在一篇发表在UC伯克利助理教授Benjamin Recht个人博客argmin上的文章中,Raji对此进行了详细阐述。她指出,在现实世界中的数据往往是动态变化的,不确定的,而模型如果没有考虑这些变化,就可能出现系统性错误。例如,一项由美国史诗系统公司开发、被密歇根大学医院广泛应用的败血症识别模型因频繁出现虚假报警而被紧急叫停,这是由于新冠大流行导致的人口地理学特征发生了变化所致。

Raji并非否认对数据分布偏移的研究重要性,但她认为ML社区过于执着于这一话题,并将任何失误都归咎于它。她的观点是,“分布偏移”这个术语既太具体又太模糊,它忽视了现实世界中复杂多变的情况。在现实世界中,我们面临的是动态变化和不可预知的情况,而不是静态或理想化的情景。

为了解决这一问题,Raji呼吁ML社区更加关注“有效性”,尤其是在外部有效性方面。这意味着我们需要评估模型如何泛化到新的场景和设置,不仅仅局限于静态测试集。此外,她还强调了回顾性研究与前瞻性的区别,以及前瞻性的研究对于真正理解模型性能至关重要。

通过分析JAMA的一篇关于败血症预测模型外部有效性的论文,Raji展示了一种更为全面的方法来评估模型性能。这份报告描述了一项回顾性研究,其中使用败血症预测工具来检查住院患者,并发现该工具未能正确识别67%的败血症患者,从而导致大量虚假报警。这种情况远超出了简单的心智实验或小型样本大小的问题,而是一个实际操作中的挑战,它涉及到了医生与模型交互以及其他影响结果的事项,这些事项与数据几乎无关。

总之,对于想要探索机器学习在实际应用中的效用,我们需要从单纯追求高精度开始,而应该全面考量所有可能影响结果的事项。这包括但不限于数据质量、算法设计、用户界面以及环境因素等。只有这样,我们才能确保我们的机器学习系统能够安全且可靠地工作,以满足日益增长的人类需求。

标签:

猜你喜欢

机器人 机器视觉与LE...
机器视觉与LED点光源的结合:智能照明新篇章 机器视觉技术在LED点光源中的应用 机器视觉技术对提升LED点光源的性能至关重要。通过分析和处理图像信息,系...
机器人 2023年CP...
2023年CPU排行榜:揭秘天梯图的顶尖大师们 在技术的浪潮中,CPU(中央处理单元)一直是计算机系统中的核心组件。每一年的CPU排行榜都将最优秀的产品推...
机器人 未来可穿戴设备...
未来可穿戴设备的发展趋势是怎样的? 未来可穿戴设备将更加注重智能化和个性化,随着技术的进步,这些设备将能够更好地融入我们的日常生活。它们不仅仅是简单的监测...
机器人 超越人类边界揭...
在人工智能不断进步的今天,世界上最智能的机器人已经不再是科幻电影中的幻想,而是现实生活中的一种可能。这些超级智能机器人以其卓越的计算能力和复杂的情感反应,...

强力推荐