Yoshua Bengio 等人基于学习器适应新分布的速度提出一种元学习因果结构,假设新分布由干预、智能体动作以及其它非稳态(non-stationarity)导致的稀疏分布变化引起,由此得出“正确的因果结构选择 会使学习器**更快地适应修改后的分布**”。该假设的研究将“适应修改后分布的速度”作为元学习的目标,表明“这可用于决定两个观测变量之间的因果关系”。研究结论的价值即特点和优势发现是,分布变化无需对应标准干预,学习器不具备关于干预的直接知识。因果结构可通过连续变量进行参数化,并以端到端的形式学得。研究探讨了想法的如何应用,来满足“独立机制 以及 动作和非稳态 导致的 机制内微小稀疏变化 ”的假设。
1