搜索【强化学习；】的结果

2018-real-clone2-10.8s.rar

(实战)[re:Invent 2018]-001:赛道分析-(致敬1024) 配套 train and evaluation log

2024-04-08 16:59:03 2.5MB 强化学习

1

通过simulink实现基于DDPG强化学习的控制器建模与仿真

通过simulink实现基于DDPG强化学习的控制器建模与仿真，这个是matlab自带的一个案例，在simulink入门60例中【Simulink教程案例50】，以该模型为例，对该模型进行介绍。

2024-04-08 10:23:07 228KB matlab DDPG 强化学习

1

强化学习的学习代码，算法包括Q-Learning、DQN、DDQN、PolicyGradient、ActorCritic、DDP

强化学习强化学习的学习代码，算法包括Q-Learning、DQN、DDQN、PolicyGradient、ActorCritic、DDPG、PPO、TD3、SAC。使用说明 python版本： 3.10.13 依赖库：requirements.txt 安装依赖库：pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/

2024-03-12 21:16:32 53.97MB

1

基于深度强化学习的拟人化自动驾驶行为决策研究

(1)针对自动驾驶拟人化决策需要识别驾驶风格的需求，基于客观驾驶数据和主观问卷分析了驾驶风格，提出了种驾驶风格分类模型。 (2)针对驾驶员对驾驶安全性、舒适性和行车效率的需求，分别基千深度Q网络(Deep Q Network, DQN)和优势演员评论家(Advantage Actor Criti c, A2C)两种深度强化学习算法建立了决策模型。 (3)针对当前自动驾驶决策不够拟人化的问题，基千表现更好的DQN决策模型提出了一种结合驾驶风格的拟人化决策模型。

2024-03-11 19:38:09 35.43MB 自动驾驶 深度强化学习 行为决策 毕业设计

1

pytorch实现的在线强化学习11种常见算法代码

这个资源是一个包含了使用 PyTorch 实现的11种常见在线强化学习算法的代码集合。每个算法都有独立的文件夹，可以单独运行并测试相应算法在不同环境中的性能。以下是资源中包含的算法： 1、Q-learning 2、SARSA 3、DQN (Deep Q-Network) 4、Double-DQN 5、Dueling-DQN 6、PG (Policy Gradient) 7、AC (Actor-Critic) 8、PPO (Proximal Policy Optimization) 9、DDPG (Deep Deterministic Policy Gradient) 10、TD3 (Twin Delayed DDPG) 11、SAC (Soft Actor-Critic)

2024-03-05 21:19:26 6.68MB pytorch 强化学习 python

1

动态避障 ROS机器人强化学习

使用深度强化学习算法实现端到端的无人车避障使用ROS和gazebo环境下仿真 python脚本编写

2024-02-24 20:12:35 4.42MB python

1

精品--基于深度强化学习的部分计算任务卸载延迟优化.zip

精品--基于深度强化学习的部分计算任务卸载延迟优化

2024-02-05 23:31:06 4KB

1

论文研究 - 量子神经网络的分布强化学习

传统的强化学习（RL）使用回报（也称为累积随机奖励的期望值）来训练代理学习最佳策略。但是，最近的研究表明，学习学习收益的分布要比学习其预期价值具有不同的优势，如在不同的RL任务中所见。从使用传统RL的收益期望到分配RL收益分配的转变，为RL的动力学提供了新见解。本文基于我们最近的研究RL量子方法的工作。我们的工作使用量子神经网络实现了分位数回归（QR）分布Q学习。该量子网络在具有不同分位数的网格世界环境中进行了评估，说明了其对算法学习的详细影响。还将其与马尔可夫决策过程（MDP）链中的标准量子Q学习进行了比较，这表明量子QR分布Q学习比标准量子Q学习可以更有效地探索环境。 RL中的主要挑战是有效的勘探以及开发与勘探的平衡。先前的工作表明，可以从分布的角度采取更多有益的措施。我们的研究结果表明了其成功的另一个原因：分布式RL的性能增强可以部分归因于其有效探索环境的卓越能力。

2024-01-10 23:17:13 627KB 连续变量量子计算机 量子强化学习 分布强化学习 分位数回归

1

基于强化学习+MPC模型预测控制算法的车辆变道轨迹跟踪控制MATLAB仿真

matlab，强化学习MPC模型预测控制算法基于强化学习+MPC模型预测控制算法的车辆变道轨迹跟踪控制MATLAB仿真使用matlab2021a或者更高版本运行！！！！

2023-12-08 09:42:15 5.87MB matlab 强化学习 模型预测控制

《深入浅出机器学习》之强化学习

本文来自于简书，本文章主要通过举例来论证机器学习算法，通过矩阵进行强化学习介绍。所谓强化学习就是智能系统从环境到行为映射的学习，以使奖励信号(强化信号)函数值最大。如果Agent的某个行为策略导致环境正的奖赏(强化信号)，那么Agent以后产生这个行为策略的趋势便会加强-《百科》

2023-11-26 20:28:26 507KB

1

个人信息

热门下载

最新下载

其他资源