只为小站
首页
域名查询
文件下载
登录
2018-real-clone2-10.8s.rar
(实战)[re:Invent 2018]-001:赛道分析-(致敬1024) 配套 train and evaluation log
2024-04-08 16:59:03
2.5MB
强化学习
1
通过simulink实现基于DDPG
强化学习
的控制器建模与仿真
通过simulink实现基于DDPG
强化学习
的控制器建模与仿真,这个是matlab自带的一个案例,在simulink入门60例中【Simulink教程案例50】,以该模型为例,对该模型进行介绍。
2024-04-08 10:23:07
228KB
matlab
DDPG
强化学习
1
强化学习
的学习代码,算法包括Q-Learning、DQN、DDQN、PolicyGradient、ActorCritic、DDP
强化学习
强化学习
的学习代码,算法包括Q-Learning、DQN、DDQN、PolicyGradient、ActorCritic、DDPG、PPO、TD3、SAC。 使用说明 python版本: 3.10.13 依赖库:requirements.txt 安装依赖库:pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/
2024-03-12 21:16:32
53.97MB
1
基于深度
强化学习
的拟人化自动驾驶行为决策研究
(1)针对自动驾驶拟人化决策需要识别驾驶风格的需求, 基于客观驾驶数据和主观问卷分析了驾驶风格,提出了 种驾驶风格分类模型。 (2)针对驾驶员对驾驶安全性、舒适性和行车效率的需求, 分别基千深度Q网络(Deep Q Network, DQN)和优势演员评论家(Advantage Actor Criti c, A2C)两种深度
强化学习
算法建立了决策模型。 (3)针对当前自动驾驶决策不够拟人化的问题,基千表现更好的DQN决策模型提出了一种结合驾驶风格的拟人化决策模型。
2024-03-11 19:38:09
35.43MB
自动驾驶
深度强化学习
行为决策
毕业设计
1
pytorch实现的在线
强化学习
11种常见算法代码
这个资源是一个包含了使用 PyTorch 实现的11种常见在线
强化学习
算法的代码集合。每个算法都有独立的文件夹,可以单独运行并测试相应算法在不同环境中的性能。以下是资源中包含的算法: 1、Q-learning 2、SARSA 3、DQN (Deep Q-Network) 4、Double-DQN 5、Dueling-DQN 6、PG (Policy Gradient) 7、AC (Actor-Critic) 8、PPO (Proximal Policy Optimization) 9、DDPG (Deep Deterministic Policy Gradient) 10、TD3 (Twin Delayed DDPG) 11、SAC (Soft Actor-Critic)
2024-03-05 21:19:26
6.68MB
pytorch
强化学习
python
1
动态避障 ROS机器人
强化学习
使用深度
强化学习
算法实现端到端的无人车避障 使用ROS和gazebo环境下仿真 python脚本编写
2024-02-24 20:12:35
4.42MB
python
1
精品--基于深度
强化学习
的部分计算任务卸载延迟优化.zip
精品--基于深度
强化学习
的部分计算任务卸载延迟优化
2024-02-05 23:31:06
4KB
1
论文研究 - 量子神经网络的分布
强化学习
传统的
强化学习
(RL)使用回报(也称为累积随机奖励的期望值)来训练代理学习最佳策略。 但是,最近的研究表明,学习学习收益的分布要比学习其预期价值具有不同的优势,如在不同的RL任务中所见。 从使用传统RL的收益期望到分配RL收益分配的转变,为RL的动力学提供了新见解。 本文基于我们最近的研究RL量子方法的工作。 我们的工作使用量子神经网络实现了分位数回归(QR)分布Q学习。 该量子网络在具有不同分位数的网格世界环境中进行了评估,说明了其对算法学习的详细影响。 还将其与马尔可夫决策过程(MDP)链中的标准量子Q学习进行了比较,这表明量子QR分布Q学习比标准量子Q学习可以更有效地探索环境。 RL中的主要挑战是有效的勘探以及开发与勘探的平衡。 先前的工作表明,可以从分布的角度采取更多有益的措施。 我们的研究结果表明了其成功的另一个原因:分布式RL的性能增强可以部分归因于其有效探索环境的卓越能力。
2024-01-10 23:17:13
627KB
连续变量量子计算机
量子强化学习
分布强化学习
分位数回归
1
基于
强化学习
+MPC模型预测控制算法的车辆变道轨迹跟踪控制MATLAB仿真
matlab,
强化学习
MPC模型预测控制算法 基于
强化学习
+MPC模型预测控制算法的车辆变道轨迹跟踪控制MATLAB仿真 使用matlab2021a或者更高版本运行!!!!
2023-12-08 09:42:15
5.87MB
matlab
强化学习
模型预测控制
《深入浅出机器学习》之
强化学习
本文来自于简书,本文章主要通过举例来论证机器学习算法,通过矩阵进行
强化学习
介绍。所谓
强化学习
就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大。如果Agent的某个行为策略导致环境正的奖赏(强化信号),那么Agent以后产生这个行为策略的趋势便会加强-《百科》
2023-11-26 20:28:26
507KB
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
Spring相关的外文文献和翻译(毕设论文必备)
matpower5.0b1.zip
android studio课程设计作业PPT+设计文档+可运行源代码+设计思路
android开发期末大作业.zip
多目标微粒子群算法MOPSO MATLAB代码
基于VMD算法的信号降噪.rar
得到品控手册7.0.pdf
通过svm cnn knn对高光谱数据集PaviaU进行分类(matlab)
C4.5决策树算法的Python代码和数据样本
全国河流水文站坐标.xls
voc车辆检测数据集(已处理好,可直接训练)
基于FPGA的DDS信号发生器设计(频率、幅度、波形可调)
Python+OpenCV实现行人检测(含配置说明)
现代操作系统原理与实现.pdf
数据结构课后习题答案
最新下载
自动驾驶车辆的换道轨迹规划与跟踪控制
云计算基础架构与实践-PPT课件
梅加强数学分析
TMS320F280049c_PWM.zip
中国各省市级地图数据shp
数据可视化~BOSS直聘分析.zip
Quite Imposing Plus 4.0G中文版
UG586赛灵思 DDR3的IP核(MIG)详细文档
RAD_Studio_10.4_KeyPatch
Atoll.Demo地图数据
其他资源
FoxitReader SDK Pro ActiveX 3.0 本人破解版
国家基础地理信息系统数据 shp格式
IEEE33/IEEE30/IEEE8/IEEE14/IEEE40经典算例潮流计算.zip
jQuery bootstrap制作input数字加减插件
SpringBoot 简单登录功能 拦截器实现.zip
机器人工作空间求解代码
MOPSO+例子
AES加密算法C++语言实现
Android 图像增强
eas全模块50000License
Financial Accounting(9th) 无水印原版pdf
罗升伺服sd系列通讯软件
RF计算器ART RF
基于可穿戴式EEG的抑郁监测实时系统
武德莫-源码
libstdc++.so.6
论坛java代码实现
时间序列MATLAB代码
AutoItLibrary-1.1_x64.rar
SFMtoolKit3工程