与抽象状态相关联.这种关联性信息可以产生对应 问题的学习 技 巧(也 称 为 Option).例 如,在 著 名 的 出租车问题中[87],其中的一组抽象状态是出租车起 始和乘客所处的位置,那么此时Option就是从出租 车起始位置到乘客所处位置的一系列动作组合.很 明显,生成的Option相当于h-DQN模型中设定的 中间目标,省去了复杂的人工设定中间目标的过程, 并使得学习到的Option与具体的学习任务无关.因 此在相同的状态空间下,该模型具有很强的泛化性. 6.3 深度后续强化学习 一般地,在 只 给 定 原 始 输 入 观 察 和 奖 赏 值 的 情况下,通 过 基 于 模 型(model-based)或 者 模 型 无 关(model-free)的DRL算 法 可 以 学 习 到 鲁 棒 的 值 函数.后 续 状 态 表 示 法(Successor Representation, SR)为学习值函数提供了第3种选择.SR将值函数 分解为两个部分:后续状态映射图(successor map) 和立即奖赏指示器(reward predictor).后续状态映 射图表示在给定当前状态下到达未来某一状态占有 率的期望.立即奖赏指示器表示从状态到奖赏值的 映射.在SR中,这两个部分以内积的形式构成值函 数.基于上述理论知识,Kulkarni等人[88]将SR的应 用范围扩展到大规模状态空间的DRL问题中,提出 了深度后续强化学习(Deep Successor Reinforcement Learning,DSRL). 21 计  算  机  学  报 2018年
1
基于phython编程的遥感影像重采样代码
2021-09-09 16:25:36 90.21MB 03
1
经典遥感教材 梅安新的遥感导论 并且是pdf格式的 敬请大家下载使用和学习。
2021-09-09 14:35:17 9.09MB 遥感 梅安新
1
适合在校大学生、遥感初学者学习使用。资料包括高分辨率遥感影像处理过程文件、处理过程截图、各个处理工具的说明、ROI的选择结果、多波段数据的构建、遥感地物分类的结果。可以直接拿去作为遥感课程设计的文档,上交老师,也可以下载作为学习CART自动决策树分类的资料。
GDAL图像格式转换与保存的介绍和使用方法。
2021-09-09 11:37:22 1.68MB GDAL 遥感 图像处理 C++
1
易康插件
2021-09-08 21:03:48 7.37MB 遥感 易康插件 ESP1 ESP2
1
matlab开发-地球卫星遥感卫星图。用政治边界和网格线绘制地球卫星图。
2021-09-08 11:38:39 452KB 未分类
1
GB/T 14950-2009 你懂的!!~ 标准编号:GB/T 14950-2009 标准名称:摄影测量与遥感术语 英文名称:Terms of photogrammetry and remote sensing 起草单位:国家测绘局测绘标准化研究所 归口单位:全国地理信息标准化技术委员会 代替标准:GB/T 14950-1994 发布日期:2009-02-06 实施日期:2009-06-01 标准格式:PDF
2021-09-08 10:48:32 2.69MB 摄影测量 遥感
1
Qt环境下c++语言所写,可对读入的遥感图像数据经行包括滤波、旋转、缩放、提取各波段基本统计值等多个功能。结果为一带菜单的Qt界面,处理后的图像被显示在界面上。
2021-09-08 09:03:57 20KB RS
1
6s大气传输模型V4.1,压缩包形式,里面包含可执行文件6s.exe还有输入文件和批处理文件,其中6s.bat里面的代码路径需要改成当前文件路径,改了之后便可以成功执行,输出一个out.txt文件
2021-09-07 13:28:15 863KB 遥感 大气传输 6s模型 气溶胶
1