只为小站
首页
域名查询
文件下载
登录
2018-real-clone2-10.8s.rar
(实战)[re:Invent 2018]-001:赛道分析-(致敬1024) 配套 train and evaluation log
2024-04-08 16:59:03
2.5MB
强化学习
1
通过simulink实现基于DDPG强化学习的控制器建模与仿真
通过simulink实现基于DDPG强化学习的控制器建模与仿真,这个是matlab自带的一个案例,在simulink入门60例中【Simulink教程案例50】,以该模型为例,对该模型进行介绍。
2024-04-08 10:23:07
228KB
matlab
DDPG
强化学习
1
强化学习的学习代码,算法包括Q-Learning、DQN、DDQN、PolicyGradient、ActorCritic、DDP
强化学习 强化学习的学习代码,算法包括Q-Learning、DQN、DDQN、PolicyGradient、ActorCritic、DDPG、PPO、TD3、SAC。 使用说明 python版本: 3.10.13 依赖库:requirements.txt 安装依赖库:pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/
2024-03-12 21:16:32
53.97MB
1
基于深度强化学习的拟人化自动驾驶行为决策研究
(1)针对自动驾驶拟人化决策需要识别驾驶风格的需求, 基于客观驾驶数据和主观问卷分析了驾驶风格,提出了 种驾驶风格分类模型。 (2)针对驾驶员对驾驶安全性、舒适性和行车效率的需求, 分别基千深度Q网络(Deep Q Network, DQN)和优势演员评论家(Advantage Actor Criti c, A2C)两种深度强化学习算法建立了决策模型。 (3)针对当前自动驾驶决策不够拟人化的问题,基千表现更好的DQN决策模型提出了一种结合驾驶风格的拟人化决策模型。
2024-03-11 19:38:09
35.43MB
自动驾驶
深度强化学习
行为决策
毕业设计
1
pytorch实现的在线强化学习11种常见算法代码
这个资源是一个包含了使用 PyTorch 实现的11种常见在线强化学习算法的代码集合。每个算法都有独立的文件夹,可以单独运行并测试相应算法在不同环境中的性能。以下是资源中包含的算法: 1、Q-learning 2、SARSA 3、DQN (Deep Q-Network) 4、Double-DQN 5、Dueling-DQN 6、PG (Policy Gradient) 7、AC (Actor-Critic) 8、PPO (Proximal Policy Optimization) 9、DDPG (Deep Deterministic Policy Gradient) 10、TD3 (Twin Delayed DDPG) 11、SAC (Soft Actor-Critic)
2024-03-05 21:19:26
6.68MB
pytorch
强化学习
python
1
动态避障 ROS机器人 强化学习
使用深度强化学习算法实现端到端的无人车避障 使用ROS和gazebo环境下仿真 python脚本编写
2024-02-24 20:12:35
4.42MB
python
1
精品--基于深度强化学习的部分计算任务卸载延迟优化.zip
精品--基于深度强化学习的部分计算任务卸载延迟优化
2024-02-05 23:31:06
4KB
1
论文研究 - 量子神经网络的分布强化学习
传统的强化学习(RL)使用回报(也称为累积随机奖励的期望值)来训练代理学习最佳策略。 但是,最近的研究表明,学习学习收益的分布要比学习其预期价值具有不同的优势,如在不同的RL任务中所见。 从使用传统RL的收益期望到分配RL收益分配的转变,为RL的动力学提供了新见解。 本文基于我们最近的研究RL量子方法的工作。 我们的工作使用量子神经网络实现了分位数回归(QR)分布Q学习。 该量子网络在具有不同分位数的网格世界环境中进行了评估,说明了其对算法学习的详细影响。 还将其与马尔可夫决策过程(MDP)链中的标准量子Q学习进行了比较,这表明量子QR分布Q学习比标准量子Q学习可以更有效地探索环境。 RL中的主要挑战是有效的勘探以及开发与勘探的平衡。 先前的工作表明,可以从分布的角度采取更多有益的措施。 我们的研究结果表明了其成功的另一个原因:分布式RL的性能增强可以部分归因于其有效探索环境的卓越能力。
2024-01-10 23:17:13
627KB
连续变量量子计算机
量子强化学习
分布强化学习
分位数回归
1
基于强化学习+MPC模型预测控制算法的车辆变道轨迹跟踪控制MATLAB仿真
matlab,强化学习MPC模型预测控制算法 基于强化学习+MPC模型预测控制算法的车辆变道轨迹跟踪控制MATLAB仿真 使用matlab2021a或者更高版本运行!!!!
2023-12-08 09:42:15
5.87MB
matlab
强化学习
模型预测控制
《深入浅出机器学习》之强化学习
本文来自于简书,本文章主要通过举例来论证机器学习算法,通过矩阵进行强化学习介绍。所谓强化学习就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大。如果Agent的某个行为策略导致环境正的奖赏(强化信号),那么Agent以后产生这个行为策略的趋势便会加强-《百科》
2023-11-26 20:28:26
507KB
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
Autojs 例子 源码 1600多个教程源码
sqlite运行所需Vc++运行环境,纯净版System.Data.SQLite.dll及SQLite.Interop.dll
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
机械臂避障路径规划仿真 蚁群算法 三维路径规划
avantage 软件 xps 处理软件30天后不能使用问题
VideoDownloadHelper去除120分钟时间限制-高级版.zip
基于Matlab的IEEE14节点潮流计算.zip
基于蒙特卡洛生成电动汽车充电负荷曲线程序
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
东南大学英语技术写作慕课所有答案
SSM外文文献和翻译(毕设论文精品).doc
transformer_pytorch_inCV.rar
2021华为芯片研发岗位笔试题
大学生网页设计大作业-5个网页设计制作作品自己任选
matlab机器人工具箱实现机械臂直线轨迹&圆弧轨迹规划
最新下载
BABOK V3.0 官方足本 业务分析必读之一 共514页
BABOK中文版.7z
SM768集成显卡手册
Artificial Intelligence: A Modern Approach 课程课件
2023全国职业院校技能大赛-GZ019 机电一体化技术赛题10套.rar
程序员的自我修养—链接、装载与库.pdf
Cracking the Coding Interview 6th 第6版 高清完整版PDF
综合评分法投标得分计算器
Gamebryo2.6 带源码完整版(20.6.0.0b)
Y400&Y500 BIOS Back And Recovery.zip
其他资源
毕业论文(设计)指导过程记录表
STM32 实现12864液晶屏显示汉字和图片,且可在任意位置画点、横线、竖线、斜线。
交互式计算机图形学 基于OpenGL着色器的自顶向下方法 第6版_中文版
cocos creator 消灭星星
Non linear equality and inequality constrained PSO(利用粒子群算法求解非线性等式和不等式约束的最小值)
蓝桥杯比赛必用知识
STM32 TLV5616程序
方言处理系统5.0版
linux ov5640驱动源码
中控指纹仪客户端插件Zkonline支持window7-64bit
scikit_learn-0.19.0-cp27-cp27m-win_amd64.whl
通信协议面试总结
DISCUZ模板_迪恩旅游风(HWY) 商业版GBK+UTF.txt
技术状态管理.pdf
DDI0487E_a_armv8_arm.pdf
MATLAB中的经济模型
文本笑话数据库2w多条数据,mysql直接导入即可,希望可以帮到你
Information Dashboard Design-Stephen Few
Android瀑布流照片墙实现,体验不规则排列的美感Demo
不定长中文识别keras
GPS 应用程序设计
自动贩卖机的实现和状态机图