级别: 院长
UID: 117704
精华: 0
发帖: 1281
威望: 15 点
积分转换
愚愚币: 132 YYB
在线充值
贡献值: 0 点
在线时间: 98(小时)
注册时间: 2012-11-08
最后登录: 2022-08-22
楼主  发表于: 2018-08-21 08:51

 学习因果关系和基于因果性的学习

愚愚学园www.SciFans.net温馨提示:
人们在日常生活里以及各种科学探索和决策过程中,都常常追问为什么这样的因果性问题。为了能干预当前系统从而达到特定的目的,我们需要透过相关性,找到并利用因果性。还有一些问题看似无关为什么,但其实答案也存在因果关系中。比如在评价特定人或事的时候,我们往往需要想象在同样的环境中,如果换了一个人或者那件事没有发生,结果又会如何。拿这个假想结果和现实情况对比,人或事所起到的因果效应就显示出来了。按卡尔荣格的说法,正是对因果关系的在意,催生了现代科学的诞生和发展。目前的因果性研究致力于回答以下问题:通过分析观测的数据,我们能精确地找出数据背后的因果关系吗?如何使人工智能系统理解环境并具备外推能力?如何能在复杂、可变的环境里做最优预测和控制?因果关系有哪些我们还未察觉的用途?

    《国家科学评论》最近发表了美国卡耐基梅隆大学张坤、Peter Spirtes、Clark Glymour和德国马普智能系统研究所Bernhard Schlkopf共同撰写的观点文章Learning Causality and Causality-Related Learning(National Science Review 2018; 1: 26-29. https://doi.org/10.1093/nsr/nwx137),简要阐述了该研究领域的一些进展以及目前大家比较**************的方向。找因果关系的传统方法需要做人为干涉或随机实验,这个过程非常昂贵,有时甚至无法做到。因此,人们需要从观测数据中找出因果关系,这个问题统称为因果发现。得益于过去30年数个领域在此问题上的进展,即使没有时间先后信息,现在也有一系列方法能在特定前提下解决这个问题,这也提供了另一个分析大数据的途径。在20世纪90年代,学者们发现虽然相关性不直接蕴含因果性,但如果引入一些普遍能接受的假设,就可以从变量的条件独立关系中找到他们之间的因果信息。遗憾的是,这类方法一般不能找出唯一的因果图,而是找到一类图,它们有同样的无向连接,但一些因果方向未必相同。

    过去10年的研究把这个结果往前推进了一步假设因果过程服从某些函数模型,那么在一般情况下,反方向是不可能服从这个模型的。具体来说,在反方向,我们是找不到独立的噪声的,这就直接给出了因和果在统计意义上的不对称性。其中,后非线性因果函数模型(post-nonlinear causal model)在NIPS 2008因果挑战****中,在所给数据集上都正确区分出了因和果。这个结果改变了一些人的看法原来单纯从独立同分布的数据中是可以看出谁是因谁是果的。如图1所示,如果因果过程为线性且因X和因果过程中的噪声是非高斯的(图中它们是均匀分布的),因X和果Y具有不对称性。为了实现更鲁棒、实用的因果发现,文中还列出了5个近年来已经引起重视的现实问题,包括:确定性因果关系,如何使用非平稳或异质数据更有效地找到因果关系,以及如何处理非理想数据采集方式带来的观测噪声和数据选择偏差等。

    文章还探讨了如何从因果关系的角度去理解以及解决某些机器学习问题。大致来说,传统机器学习往往假设数据的分布不变,而目前随着机器学习的广泛应用,我们需要考虑更实际的包含异质数据的问题,比如半监督学习和迁移学习。这类问题的解决可获益于因果系统的性质:首先,我们可以以不变应万变即使数据分布发生变化,因果关系是相对稳定的,因为它对应着实际的物理过程;其次,我们可以分而治之一般来说,因果系统里因的产生过程和因产生果的过程是没有联系的,即使这两个过程都发生了变化,我们也可以把它们各个击破;再次,我们可以四两拨千斤因果过程对应着实际的物理规律,顺着这个过程去构建数据的分布特性往往更简单。目前,该领域的很多研究人员致力于找出更广泛实用、更高效的因果发现方法,以及从因果的角度去开发更具智能的机器学习系统。(来源:科学网)
分享:

愚愚学园属于纯学术、非经营性专业网站,无任何商业性质,大家出于学习和科研目的进行交流讨论。

如有涉侵犯著作权人的版权等信息,请及时来信告知,我们将立刻从网站上删除,并向所有持版权者致最深歉意,谢谢。