揭秘旅游新趋势单靠分布偏移远不够真实数据背后的外部有效性之谜等待解答
揭秘最新旅游趋势:单靠分布偏移远不够!真实数据背后的外部有效性之谜等待解答
在探索人工智能技术的应用领域,特别是其中的可信人工智能系统中,研究者们一直关注于一个关键问题——数据分布偏移。然而,纽约大学AI Now研究所的技术研究员Deborah Raji提出了一个深刻的问题:仅仅关注数据分布偏移是否足够?她认为,更重要的是要考虑到外部有效性的概念。
在一篇发表在UC伯克利助理教授Benjamin Recht个人博客argmin上的文章中,Raji对此进行了详细阐述。她指出,在现实世界中的数据往往是动态变化的,不确定的,而模型如果没有考虑这些变化,就可能出现系统性错误。例如,一项由美国史诗系统公司开发、被密歇根大学医院广泛应用的败血症识别模型因频繁出现虚假报警而被紧急叫停,这是由于新冠大流行导致的人口地理学特征发生了变化所致。
Raji并非否认对数据分布偏移的研究重要性,但她认为ML社区过于执着于这一话题,并将任何失误都归咎于它。她的观点是,“分布偏移”这个术语既太具体又太模糊,它忽视了现实世界中复杂多变的情况。在现实世界中,我们面临的是动态变化和不可预知的情况,而不是静态或理想化的情景。
为了解决这一问题,Raji呼吁ML社区更加关注“有效性”,尤其是在外部有效性方面。这意味着我们需要评估模型如何泛化到新的场景和设置,不仅仅局限于静态测试集。此外,她还强调了回顾性研究与前瞻性的区别,以及前瞻性的研究对于真正理解模型性能至关重要。
通过分析JAMA的一篇关于败血症预测模型外部有效性的论文,Raji展示了一种更为全面的方法来评估模型性能。这份报告描述了一项回顾性研究,其中使用败血症预测工具来检查住院患者,并发现该工具未能正确识别67%的败血症患者,从而导致大量虚假报警。这种情况远超出了简单的心智实验或小型样本大小的问题,而是一个实际操作中的挑战,它涉及到了医生与模型交互以及其他影响结果的事项,这些事项与数据几乎无关。
总之,对于想要探索机器学习在实际应用中的效用,我们需要从单纯追求高精度开始,而应该全面考量所有可能影响结果的事项。这包括但不限于数据质量、算法设计、用户界面以及环境因素等。只有这样,我们才能确保我们的机器学习系统能够安全且可靠地工作,以满足日益增长的人类需求。