搜索【强化学习】的结果

berkeley-intro-to-artificial-intelligence:加州大学伯克利分校CS188人工智能入门-使用Pacman进行搜索和强化学习

2022-06-26 13:19:00 358KB Python

1

强化学习导论

强化学习导论，2018年1月完整版，Richard S. Sutton和 Andrew G. Barto所著

2022-06-25 11:09:33 12.26MB 强化学习

1

基于强化学习的适应性微粒群算法

惯性权重是微粒群算法(PSO) 的重要参数, 它可以平衡算法的全局和局部搜索能力的关系, 改善算法的性
能. 对此, 提出一种基于强化学习的适应性微粒群算法(RPSO). 首先将不同惯性权重调整策略视为粒子的行动集合;
然后通过计算??函数值, 考察粒子多步进化的效果; 进而选择粒子最优进化策略, 动态调整惯性权重, 以增强算法寻
找全局最优的能力. 对几种经典函数的测试结果表明, RPSO 能够获得良好的性能, 特别是对多峰函数效果更加明显.

2022-06-20 09:28:19 189KB 微粒群算法|惯性权重|自适应|强化学习

1

各种强化学习算法

2022-06-19 21:55:35 109KB 各种强化学习算法

1

论文研究-基于强化学习的无人坦克对战仿真研究.pdf

对标准的强化学习进行改进，通过引入动机层，来引入先验知识，加快学习速度。策略迭代选择上，通过采用“同策略”迭代的Sarsa学习算法，代替传统的“异策略”Q学习算法。提出了基于多动机引导的Sarsa学习（MMSarsa）算法，分别和Q学习算法、Sarsa学习算法在坦克对战仿真问题上进行了三种算法的对比实验。实验结果表明，基于多动机引导的Sarsa学习算法收敛速度快且学习效率高。

2022-06-18 12:05:21 738KB 论文研究

1

国开形考一实验小程序课时作业答案仅供参考

2022-06-12 12:04:14 4KB 参考资源 强化学习

1

ddpg-aigym：具有深度强化学习的连续控制-在OpenAI Gym环境中实现的深度确定性策略梯度（DDPG）算法

ddpg-aigym 深度确定性策略梯度 Tensorflow中深度确定性策略梯度算法的实现（Lillicrap等人。）如何使用 git clone https://github.com/stevenpjg/ddpg-aigym.git cd ddpg-aigym python main.py 培训期间一旦训练学习曲线 InvertedPendulum-v1环境的学习曲线。依存关系 Tensorflow（在tensorflow版本0.11.0rc0 ） OpenAi体育馆 Mujoco 产品特点批量归一化（提高学习速度）梯度转换器（在arXiv中提供：）注意使用不同

2022-06-10 08:26:41 322KB reinforcement-learning deep-learning tensorflow TensorflowPython

1

强化学习笔记和学习材料

2022-06-07 15:35:05 67.45MB 强化学习 笔记

1

Pyhton 强化学习实战书籍代码

Python 强化学习实战应用OpenAI Gym和TensorFlow精通强化学习和深度强化学习书籍代码

2022-06-07 15:34:07 42.84MB 强化学习 深度强化学习 TensorFlow

1

国科大强化学习18-19春季

2016年AlphaGo战胜人类顶级围棋选手，标志人工智能的一个重要里程碑事件，其中强化学习方法做出了重要的贡献。麻省理工、斯坦福、卡内基梅隆等著名学府纷纷开设或着重强化学习的课程。强化学习是人工智能中最活跃的研究领域之一。强化学习不同于监督学习，强化学习根据系统的状态做出动作，由环境给出奖惩信号，通过学习获得使累计奖惩最高的动作策略。也就是一种基于数据通过自学习方式获得最优决策和控制的方法。在棋类博弈、智能驾驶、机器人控制等领域都有广泛成功的应用。

2022-06-07 15:30:47 28.06MB 强化学习

个人信息

热门下载

最新下载

其他资源