搜索【强化学习；】的结果

机器学习课程笔记（第一章的第一节和第二节）

机器学习课程笔记（第一章的第一节和第二节）机器学习的概念和分类

2022-10-25 12:05:11 2.22MB 机器学习 监督学习 强化学习

1

计算机围棋强化学习中的神经网络

本论文工作研究了深度学习，强化学习，深度强化学习，计算机围棋四者之间的关系，从而设计出一套成熟的计算机深度强化学习系统

2022-10-24 13:10:01 3.96MB

1

python编写，即跑即用，no bugs，有训练好的model。使用蒙特卡洛树搜索与深度神经网络来设计一种基于强化学习的AI五子棋算法，实现了从零开始学习五子棋博弈的人工智能算法。

2022-10-24 13:10:00 1.64MB 蒙特卡洛搜索 策略价值网络强化学习 AI五子棋算法 强化学习

强化学习的Q-learning算法和sarsa算法以及结果图

路径规划问题，有三种环境配置可实现，以下是代码来源，基于此做的实验 https://blog.csdn.net/jacken3/article/details/119803094

2022-10-18 20:05:16 472KB 强化学习 路径规划

1

强化学习经典文献R-learning

Average reward reinforcement learning Foundations algorithms and empirical results (1996)：强化学习采用平均奖励目标函数

2022-10-17 17:07:24 2.14MB

1

策略梯度算法PPO+代码解读

2022-10-17 13:05:45 842KB 强化学习 PPO

1

REINFORCE理论+实现代码

2022-10-17 13:05:44 2.12MB 强化学习 REINFORCE 策略梯度 实现代码

1

第2课马尔可夫决策过程

2022-10-17 13:05:43 334KB 马尔可夫决策过程 MDP 强化学习

1

第4课强化学习中的蒙特卡洛方法

2022-10-17 13:05:41 2.03MB 强化学习 蒙特卡洛

1

第5课强化学习中的时间差分

2022-10-17 13:05:40 1.89MB TemporalDiffere 强化学习

1