kuka-reach-drl 训练kuka机器人在pybullet中到达带有深rl的点。 火车过程 评估过程 平均情节奖励 我强烈建议您使用Conda来安装环境,因为使用pip可能会遇到mpi4py错误。 Spinningup rl库是必需的库。 安装指南(现在仅支持linux和macos) 首先,您应该安装miniconda或anaconda。 其次,安装一些开发依赖项。 sudo apt-get update && sudo apt-get install libopenmpi-dev 第三,创建一个conda虚拟环境 conda create -n spinningup python=3.6 # python 3.6 is recommended # activate the env conda activate spinningup 最后,安装spinin
2023-12-26 18:27:32 5.3MB Python
1
用深度强化学习的方法实现频谱共享。频谱资源是一种有限资源。在自适应的实现频谱共享方面,DRL与频谱共享结合是一个十分有潜力的方向。
2023-04-19 09:21:27 942KB spectrumsharing 共享 深度强化学习 DRL
1
MiVeCC_with_DRL 这是一种多路口车辆合作控制(MiVeCC)方案,可实现3 * 3无信号交叉口中车辆之间的协作。 我们提出了一种结合启发式规则和两阶段深度强化学习的算法。 启发式规则使车辆通过交叉路口而不会发生碰撞。 基于启发式规则,DDPG用于优化车辆的协同控制并提高交通效率。 仿真结果表明,与现有方法相比,所提算法在不发生碰撞的情况下可将多个路口的出行效率提高4.59倍。 一种基于端边云计算的多路口车辆协同控制| 先决条件 Linux 或 macOS Python 3 MATLAB 2017b CPU或NVIDIA GPU + CUDA CuDNN Python模块 numpy==1.16.2 opencv-contrib-python == 3.4.2.16 opencv-python==4.2.0.32 张量流==1.12.0 matplotlib=
2023-04-08 09:27:17 15.22MB Python
1
目前,大多数 DRL 模型事实上还停留在传统的博弈论层面,例如**纳什均衡或零和游戏**等。但随着DRL的发展,传统博弈论方法已经逐渐呈现出不足之处,而同时则有一些新的博弈论方法被纳入到人工智能的程序当中。雷锋网公众号介绍三种深刻影响 DRL 的「新」博弈论方法:平均场博弈(Mean Field Games,MFG);随机博弈(Stochastic games);进化博弈(Evolutionary Games,EGT)。本文是对公众号介绍文章的消化再整理:标注按字者,加注标签;关键地方,有粗体和下划线。适合快速而较系统的了解博弈发展状况的读者。
2023-04-08 01:04:46 11KB 深度强化学习DRL 博弈论
1
DRL用于微电网能源管理 我们针对微电网的能源管理系统问题研究了各种深度强化学习算法的性能。 我们提出了一种新颖的微电网模型,该模型由风力涡轮发电机,储能系统,恒温控制负载,价格响应负载以及与主电网的连接组成。 拟议的能源管理系统旨在通过定义优先级资源,直接需求控制信号和电价来在不同的灵活性来源之间进行协调。 本文实现了七种深度强化学习算法,并进行了实证比较。 数值结果表明,不同的深度强化学习算法在收敛到最优策略的能力上存在显着差异。 通过将经验重播和第二个半确定性训练阶段添加到众所周知的“异步优势演员评论家”算法中,我们获得了更好的性能,并且在能效和经济价值方面收敛于高级策略。 有关此项目的更多信息,访问: :
2022-08-25 22:54:53 22.94MB HTML
1
深度强化学习求解动态柔性作业车间调度问题
DRL深度强化学习无人机路径规划程序源码
2022-03-30 17:23:12 50KB 源码
1
使用带有LSTM的DRL进行库存预测 该项目专注于股票预测,我们的目标是使用带有DSTM的DRL来实现一个交易框架。
2022-02-21 17:12:33 87.05MB Python
1
DRL_GBI 我项目的代码和相关工作-结合(深度)强化学习和基于目标的投资 该项目已被选为2020年Spring商务毕业项目中的顶级项目。 还可以在Hanlon实验室网站上找到简短说明: : DDPG的代码设计 关于: 到目前为止,我已经上传了一个目标的DDPG代码。 我主要使用Stable_Baselines实现DDPG,并根据Gym界面自定义环境,以解决退休计划中指定的投资组合优化问题。 通过设置步长,我可以定期调整重量。 用法: 运行“ main_ddpg.py”并查看结果。 或者只是检查文件“结果”即可快速查看我的图。 我使用Callback监视我的训练并加载best_model来绘制结果。 数据集: 根据霍姆斯库博士的建议,我使用的投资组合包括: 4种股票指数:iShares罗素中型ETF,iShares罗素200强ETF,S&P 500指数和SPDR MSCI
2021-12-23 11:05:51 4.96MB R
1
描述 此参考设计详细展示了汽车日间行车灯 (DRL) 和位置灯的解决方案。此设计中使用的 TPS92830-Q1 线性 LED 控制器直接由汽车蓄电池供电,因此允许您使用同一 LED 实现两种功能。此参考设计还具有良好的 EMC 性能并提供全面的保护和诊断。 特性 汽车蓄电池电源 符合 CISPR 25 传导和辐射发射标准并通过了 ISO11452-4 BCI 测试 可通过使用器件内部 PWM 发生器实现 DRL/位置灯重复使用 LED 灯串开路、接地短路和电池短路诊断以及自动恢复 故障总线可配置为“连带失效”或“仅失效的通道关闭” LED 过热保护
2021-12-21 10:08:14 4.53MB 开源 电路方案
1