只为小站
首页
域名查询
文件下载
登录
maddpg-keras:在Keras中实现多代理深度确定性策略梯度(MADDPG)算法-源码
马迪克-凯拉斯 在Keras中实现多代理深度确定性策略梯度(MADDPG)算法
2021-05-09 23:13:45
7.86MB
Python
1
Multi-Agent-Deep-Deterministic-Policy-Gradients:多主体深度确定性策略梯度(MADDPG)算法的Pytorch实现-源码
多代理深确定性策略梯度 多主体深度确定性策略梯度(MADDPG)算法的Pytorch实现 这是我在论文中提出的算法的实现:“针对混合合作竞争环境的多主体Actor评论家”。 您可以在这里找到本文: : 您将需要安装多代理粒子环境(MAPE),可以在这里找到: : 确保创建具有MAPE依赖项的虚拟环境,因为它们有些过时了。 我还建议使用PyTorch 1.4.0版运行此程序,因为最新版本(1.8)似乎与我在计算批评者损失时使用的就地操作存在问题。 将主存储库克隆到与MAPE相同的目录中可能是最容易的,因为主文件需要该软件包中的make_env函数。 可以在以下位置找到本教程的视频: :
2021-05-09 23:12:07
6KB
reinforcement-learning
deep-reinforcement-learning
actor-critic-methods
actor-critic-algorithm
1
需求分布不确定条件下的多周期库存鲁棒优化模型.rar
在离散需求情景概率不确定的条件下, 建立基于最大最小方法的多周期库存鲁棒优化模型. 考虑需求分布分别隶属于区间和椭球不确定集两种情形, 运用对偶理论将多周期库存鲁棒优化模型转化为易于求解的凸规划问题. 数值结果表明, 与已知需求分布下的系统最优绩效相比, 采用鲁棒订货策略虽然会导致部分绩效损失, 但损失值很小, 表明基于鲁棒优化的多周期库存订货策略具有良好的鲁棒性, 能够有效抑制需求分布
不确定性
对库存运作绩效的影响.
2021-05-09 22:02:07
175KB
多周期库存
鲁棒优化
不确定性
订货策略
1
人工智能原理及其应用.ppt
确定性推理
2021-05-03 14:07:08
153KB
人工智能
确定性推理
DeepReinforcementLearning-DDPG-for-RoboticsControl:这是名为深度确定性策略梯度(DDPG)的深度强化学习算法的实现,以训练4自由度机械臂达到移动目标。 动作空间是连续的,学习的特工为机器人输出扭矩以移动到特定目标位置-源码
DDPGforRoboticsControl 这是名为深度确定性策略梯度(DDPG)的深度强化学习算法的实现,用于训练4自由度机械臂以达到移动目标。 动作空间是连续的,学习的代理会输出扭矩以使机器人移动到特定的目标位置。 环境 一个包含20个相同代理的,每个代理都有其自己的环境副本。 在这种环境下,双臂可以移动到目标位置。 对于代理人的手在目标位置中的每一步,将提供+0.1的奖励。 因此,座席的目标是在尽可能多的时间步中保持其在目标位置的位置。 观察空间由33个变量组成,分别对应于手臂的位置,旋转,速度和角速度。 每个动作是一个带有四个数字的向量,对应于适用于两个关节的扭矩。 动作向量中的每个条目都应为-1和1之间的数字。 解决环境 您的特工平均得分必须为+30(超过100个连续剧集,并且超过所有特工)。 具体来说,在每个情节之后,我们将每个代理商获得的奖励加起来(不打折),以获得每个
2021-04-29 11:38:55
20.38MB
JupyterNotebook
1
计及CVaR的负荷聚合商双重市场投标策略
需求侧资源的
不确定性
给负荷聚合商在双重市场(日前电能市场和日前备用市场)的投标带来了困难。首先分析需求侧资源的
不确定性
,建立负荷聚合商在双重市场的投资分配和利润模型,该模型以最大化负荷聚合商日利润为目标,并应用粒子群优化算法以及MATLAB调用YALMIP、CPLEX工具箱进行求解。进一步考虑需求侧资源
不确定性
引起的负荷聚合商利润的风险,分析随着风险偏好系数的改变利润与风险值之间的动态关系以及可中断负荷在双重市场的投标量分配,讨论日前电能市场投标约束对负荷聚合商投标策略和总体利润的影响。算例分析验证了负荷聚合商基于风险的投资策略的有效性。
2021-04-28 09:06:03
1.96MB
负荷聚合商 不确定性 双重市场 CVaR 投标策略
1
20210425-浙商证券-教育&海外行业周报:鼓励民办教育规范发展,看好高教确定性资产.pdf
20210425-浙商证券-教育&海外行业周报:鼓励民办教育规范发展,看好高教确定性资产.pdf
2021-04-26 19:03:16
1.39MB
行业咨询
考虑分布式电源
不确定性
的电力系统多目标优化模型
为了对电力系统经济可靠性的运行进行保证,实现独立运行发电系统分布式电源容量的合理优化配置,充分考虑分布式电源的
不确定性
,分析电力系统多目标优化模型。此模型基于系统经济型及风险性对分布式电源接入对于配电网的影响进行分析,根据配电网的运行状态调整算法,创建电力系统多目标优化模型。在实现模型求解的过程中,先实现目标函数的无量纲化处理,之后利用混沌变异粒子群算法得到分布式电源最优配置方案。利用算例IEEE-33母线节点系统表示,本文所设计的基于分布式电源不确定电力系统多目标优化模型能够使不同运行状态中优化要求进行满足,对系统运行条件进行改善,从而使系统运行过程中的经济性及安全性得到提高。
2021-04-25 14:54:00
1.55MB
分布式电源;
不确定新;
电力系统;
多目标优化
1
原水投药净化
不确定性
复杂过程的多模态控制
针对混凝过程难于数学建模实施精准控制,探讨了基于仿人智能的多模态加注投药控制策略.剖析了混凝过程的控制论特性与投药加注过程的控制难点,研究了加注投药的控制策略,结合原水净化站工程实践,提出了多模态的仿人智能控制算法.以二阶时滞过程加注投药控制为例,仿真实验验证了该策略在响应快速性、过程调节时间、稳态控制精度与超调性能等方面的优秀控制品质.仿真研究表明了多模态控制的可行、合理与可用性.
2021-04-22 14:17:32
672KB
原水净化
加注投药
混凝过程
控制策略
1
不确定性
决策与强化学习.pdf
不确定性
决策与强化学习.pdf
2021-04-19 14:07:18
1.93MB
强化学习
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
安卓开发期末大作业----单词本(源码,任务书,大报告,apk文件)(基于andord studio)
基于hadoop商品推荐系统课程设计
拾荒者扫描器.zip
MATLAB之LSTM预测
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
数字图像处理[冈萨雷斯]
工程伦理_李正风,丛杭青,王前_北京:清华大学出版社 , 2016.08_P329.pdf
非线性本构关系在ABAQUS中的实现.pdf
matlab时频分析工具箱+安装方法+函数说明+最新版tftb.
王万良-人工智能导论(第五版)课件
长江流域shp.zip
西门子逻辑控制设计开发_3部10层
Microsoft Visual C++ 2015-2019 运行库合集,包含32位64位
全国河流水文站坐标.xls
voc车辆检测数据集(已处理好,可直接训练)
最新下载
深思S4 加密狗型号快速检测V5.1, S4初始化工具和写狗工具最新授权 带说明
carsim与simulink联合仿真实现AEB功能
CircleOfPoison.rar
小波阈值MATLAB代码,可以实现软阈值、硬阈值以及5种改进阈值方法,封装好的函数快速实现
2022年电赛A题:单相交流电子负载 单相pwm整流 基于stm32f407vet6的单相DQ锁相环
9218-9217B增加强刷.救砖模式增量单刷脚本(内有说明).7z
ckeditor_4.14.1_full
掌讯方案9218、9217B、9217升级说明及工具(电脑升级不要勾选Preloader).rar
KT and KP(xTouch_2015-05-15.36515.rtm).zip
owncloud 8.0.16
其他资源
G50-70M BIOS原厂的
中国铁塔电能计量模块上位机软件
labview 的MODBUS 程序范例
前端网页模板
在单片机上实现的压缩代码
操作系统(第二版)习题答案
保卫萝卜unity教程(视频+源码)
五子棋java小游戏源代码
天天生鲜项目管理系统.zip
最新列车时刻表数据库(更新至2009.07.19)
S7-1500/1200 PLC PID整定调试总结
嵌入式实时操作系统uc_os-II原理及应用.pdf
halcon提取激光线中心
基于GMap.NET的地图瓦片下载器源码
具有标准稳健性的基于格的高效零知识参数:构造和应用
2021年美赛D题思路
短语:用于解决规范问题的Clojure(Script)库-源码
基于matlab水果识别
人头训练样本图片
内网渗透讲义
基于遗传神经网络的倒立摆控制研究
JAVA JSP医院住院管理系统 源代码 论文
Java反射demo