机器学习课程笔记(第一章的第一节和第二节)机器学习的概念和分类
2022-10-25 12:05:11 2.22MB 机器学习 监督学习 强化学习
1
本论文工作研究了深度学习,强化学习,深度强化学习,计算机围棋四者之间的关系,从而设计出一套成熟的计算机深度强化学习系统
2022-10-24 13:10:01 3.96MB
1
python编写,即跑即用,no bugs,有训练好的model。 使用蒙特卡洛树搜索与深度神经网络来设计一种基于强化学习的AI五子棋算法,实现了从零开始学习五子棋博弈的人工智能算法。
路径规划问题,有三种环境配置可实现,以下是代码来源,基于此做的实验 https://blog.csdn.net/jacken3/article/details/119803094
2022-10-18 20:05:16 472KB 强化学习 路径规划
1
Average reward reinforcement learning Foundations algorithms and empirical results (1996):强化学习采用平均奖励目标函数
2022-10-17 17:07:24 2.14MB
1
策略梯度算法PPO+代码解读
2022-10-17 13:05:45 842KB 强化学习 PPO
1
REINFORCE理论+实现代码
2022-10-17 13:05:44 2.12MB 强化学习 REINFORCE 策略梯度 实现代码
1
第2课 马尔可夫决策过程
2022-10-17 13:05:43 334KB 马尔可夫决策过程 MDP 强化学习
1
第4课 强化学习中的蒙特卡洛方法
2022-10-17 13:05:41 2.03MB 强化学习 蒙特卡洛
1
第5课 强化学习中的时间差分
2022-10-17 13:05:40 1.89MB TemporalDiffere 强化学习
1