Q强化学习matlab源代码,注释详细,本人亲自运行测试。
2021-06-28 10:21:53 3KB Q-学习 matlab
1
莫烦编程QL一维寻宝程序(Python改MATLAB实现)
2021-06-27 19:04:10 6KB 强化学习 matlab
1
参考 6.4 (Sarsa: On-Policy TD Control), Reinforcement learning: An Introduction, RS Sutton, AG Barto, MIT press 在这个演示中,强化学习技术 SARSA 解决了两个不同的迷宫。 State-Action-Reward-State-Action (SARSA) 是一种用于学习马尔可夫决策过程策略的算法,用于强化学习。 SARSA,动作价值函数的更新: Q(S{t}, A{t}) := Q(S{t}, A{t}) + α*[ R{t+1} + γ ∗ Q(S{t+1}, A{ t+1}) − Q(S{t}, A{t}) ] 学习率 (α) 学习率决定了新获取的信息在多大程度上覆盖旧信息。 因子为 0 将使代理不学习任何东西,而因子为 1 将使代理仅考虑最近的信息。 折扣系数 (γ)
2021-06-27 13:54:05 118KB matlab
1
强化学习算法,实现强化学习对网络资源的分配,目的是频谱利用最大化 强化学习算法,实现强化学习对网络资源的分配,目的是频谱利用最大化
2021-05-22 16:44:45 2KB 强化学习算法
1
sutton强化学习随书MATLAB代码,内附使用说明,亲测可运行,对理解书中内容很有帮助。
2021-04-26 22:00:39 164KB sutton 强化学习 MATLAB 代码
1
强化学习matlab源代码很少见的源代码,详细介绍Q学习的编程过程。
2021-03-31 08:58:53 2KB 强化学习 matlab 源代码
1
强化学习MATLAB学习资料
2021-03-15 14:09:56 9.43MB 强化学习 matlab
1
强化学习matlab源代码很少见的源代码,详细介绍Q学习的编程过程。
2019-12-21 21:12:24 3KB 强化学习 matlab 源代码
1
强化学习matlab源代码很少见的源代码,详细介绍Q学习的编程过程。
2019-12-21 20:08:04 2KB 强化学习 matlab 源代码
1
强化学习算法,实现强化学习对网络资源的分配,目的是频谱利用最大化
2019-12-21 19:24:49 6KB 强化学习算法
1