Imitation-Learning-Paper-Lists:RL中的模仿学习论文集-源码

上传者: 42109925 | 上传时间: 2021-11-23 15:08:46 | 文件大小: 12KB | 文件类型: -
仿制学习用纸清单 RL中的模仿学习论文集,并有简要介绍。 该馆藏涉及“ ,还包含自我收集的论文。 确切地说,“模仿学习”是向专家演示(LfD)学习的普遍问题。 从这种描述中可以得出两个名称,由于历史原因,它们分别是“模仿学习”和“学徒学习”。 通常,学徒制学习是在“通过逆向强化学习(IRL)进行学徒制学习”的上下文中提及的,它可以恢复奖励功能并从中学习策略,而模仿学习始于直接克隆行为的行为,即直接学习该策略( 和Morgan- Kaufmann,NIPS 1989)。 然而,随着相关研究的发展,“模仿学习”一直被用来代表一般的LfD问题设置,这也是我们的观点。 通常,模仿学习的不同设置会衍生到不同的特定领域。 一种普遍的设置是,一个人只能从不互动的专家处获得(1)对预收集的轨迹((s,a)对)(2)他可以与环境进行交互(使用模拟器)(3)而没有奖励信号。 在这里,我们列出了一些其他设置

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明