berkeley-intro-to-artificial-intelligence:加州大学伯克利分校CS188人工智能入门-使用Pacman进行搜索和强化学习
2022-06-26 13:19:00 358KB Python
1
强化学习导论,2018年1月完整版,Richard S. Sutton和 Andrew G. Barto所著
2022-06-25 11:09:33 12.26MB 强化学习
1

惯性权重是微粒群算法(PSO) 的重要参数, 它可以平衡算法的全局和局部搜索能力的关系, 改善算法的性
能. 对此, 提出一种基于强化学习的适应性微粒群算法(RPSO). 首先将不同惯性权重调整策略视为粒子的行动集合;
然后通过计算??函数值, 考察粒子多步进化的效果; 进而选择粒子最优进化策略, 动态调整惯性权重, 以增强算法寻
找全局最优的能力. 对几种经典函数的测试结果表明, RPSO 能够获得良好的性能, 特别是对多峰函数效果更加明显.

1
各种强化学习算法
2022-06-19 21:55:35 109KB 各种强化学习算法
1
对标准的强化学习进行改进,通过引入动机层,来引入先验知识,加快学习速度。策略迭代选择上,通过采用“同策略”迭代的Sarsa学习算法,代替传统的“异策略”Q学习算法。提出了基于多动机引导的Sarsa学习(MMSarsa)算法,分别和Q学习算法、Sarsa学习算法在坦克对战仿真问题上进行了三种算法的对比实验。实验结果表明,基于多动机引导的Sarsa学习算法收敛速度快且学习效率高。
2022-06-18 12:05:21 738KB 论文研究
1
国开形考一 实验小程序 课时作业答案仅供参考
2022-06-12 12:04:14 4KB 参考 资源 强化学习
1
ddpg-aigym 深度确定性策略梯度 Tensorflow中深度确定性策略梯度算法的实现(Lillicrap等人 。) 如何使用 git clone https://github.com/stevenpjg/ddpg-aigym.git cd ddpg-aigym python main.py 培训期间 一旦训练 学习曲线 InvertedPendulum-v1环境的学习曲线。 依存关系 Tensorflow(在tensorflow版本0.11.0rc0 ) OpenAi体育馆 Mujoco 产品特点 批量归一化(提高学习速度) 梯度转换器(在arXiv中提供: ) 注意 使用不同
1
强化学习笔记和学习材料
2022-06-07 15:35:05 67.45MB 强化学习 笔记
1
Python 强化学习实战 应用OpenAI Gym和TensorFlow精通强化学习和深度强化学习书籍代码
2022-06-07 15:34:07 42.84MB 强化学习 深度强化学习 TensorFlow
1
2016年AlphaGo战胜人类顶级围棋选手,标志人工智能的一个重要里程碑事件,其中强化学习方法做出了重要的贡献。麻省理工、斯坦福、卡内基梅隆等著名学府纷纷开设或着重强化学习的课程。 强化学习是人工智能中最活跃的研究领域之一。强化学习不同于监督学习,强化学习根据系统的状态做出动作,由环境给出奖惩信号,通过学习获得使累计奖惩最高的动作策略。也就是一种基于数据通过自学习方式获得最优决策和控制的方法。在棋类博弈、智能驾驶、机器人控制等领域都有广泛成功的应用。
2022-06-07 15:30:47 28.06MB 强化学习
服务器状态检查中...