搜索【不确定性】的结果

maddpg-keras:在Keras中实现多代理深度确定性策略梯度（MADDPG）算法-源码

马迪克-凯拉斯在Keras中实现多代理深度确定性策略梯度（MADDPG）算法

2021-05-09 23:13:45 7.86MB Python

1

Multi-Agent-Deep-Deterministic-Policy-Gradients:多主体深度确定性策略梯度（MADDPG）算法的Pytorch实现-源码

多代理深确定性策略梯度多主体深度确定性策略梯度（MADDPG）算法的Pytorch实现这是我在论文中提出的算法的实现：“针对混合合作竞争环境的多主体Actor评论家”。您可以在这里找到本文： : 您将需要安装多代理粒子环境（MAPE），可以在这里找到： : 确保创建具有MAPE依赖项的虚拟环境，因为它们有些过时了。我还建议使用PyTorch 1.4.0版运行此程序，因为最新版本（1.8）似乎与我在计算批评者损失时使用的就地操作存在问题。将主存储库克隆到与MAPE相同的目录中可能是最容易的，因为主文件需要该软件包中的make_env函数。可以在以下位置找到本教程的视频： :

2021-05-09 23:12:07 6KB reinforcement-learning deep-reinforcement-learning actor-critic-methods actor-critic-algorithm

1

需求分布不确定条件下的多周期库存鲁棒优化模型.rar

在离散需求情景概率不确定的条件下, 建立基于最大最小方法的多周期库存鲁棒优化模型. 考虑需求分布分别隶属于区间和椭球不确定集两种情形, 运用对偶理论将多周期库存鲁棒优化模型转化为易于求解的凸规划问题. 数值结果表明, 与已知需求分布下的系统最优绩效相比, 采用鲁棒订货策略虽然会导致部分绩效损失, 但损失值很小, 表明基于鲁棒优化的多周期库存订货策略具有良好的鲁棒性, 能够有效抑制需求分布不确定性对库存运作绩效的影响.

2021-05-09 22:02:07 175KB 多周期库存 鲁棒优化 不确定性 订货策略

1

人工智能原理及其应用.ppt

确定性推理

2021-05-03 14:07:08 153KB 人工智能 确定性推理

DeepReinforcementLearning-DDPG-for-RoboticsControl：这是名为深度确定性策略梯度（DDPG）的深度强化学习算法的实现，以训练4自由度机械臂达到移动目标。动作空间是连续的，学习的特工为机器人输出扭矩以移动到特定目标位置-源码

DDPGforRoboticsControl 这是名为深度确定性策略梯度（DDPG）的深度强化学习算法的实现，用于训练4自由度机械臂以达到移动目标。动作空间是连续的，学习的代理会输出扭矩以使机器人移动到特定的目标位置。环境一个包含20个相同代理的，每个代理都有其自己的环境副本。在这种环境下，双臂可以移动到目标位置。对于代理人的手在目标位置中的每一步，将提供+0.1的奖励。因此，座席的目标是在尽可能多的时间步中保持其在目标位置的位置。观察空间由33个变量组成，分别对应于手臂的位置，旋转，速度和角速度。每个动作是一个带有四个数字的向量，对应于适用于两个关节的扭矩。动作向量中的每个条目都应为-1和1之间的数字。解决环境您的特工平均得分必须为+30（超过100个连续剧集，并且超过所有特工）。具体来说，在每个情节之后，我们将每个代理商获得的奖励加起来（不打折），以获得每个

2021-04-29 11:38:55 20.38MB JupyterNotebook

1

计及CVaR的负荷聚合商双重市场投标策略

需求侧资源的不确定性给负荷聚合商在双重市场(日前电能市场和日前备用市场)的投标带来了困难。首先分析需求侧资源的不确定性，建立负荷聚合商在双重市场的投资分配和利润模型，该模型以最大化负荷聚合商日利润为目标，并应用粒子群优化算法以及MATLAB调用YALMIP、CPLEX工具箱进行求解。进一步考虑需求侧资源不确定性引起的负荷聚合商利润的风险，分析随着风险偏好系数的改变利润与风险值之间的动态关系以及可中断负荷在双重市场的投标量分配，讨论日前电能市场投标约束对负荷聚合商投标策略和总体利润的影响。算例分析验证了负荷聚合商基于风险的投资策略的有效性。

2021-04-28 09:06:03 1.96MB 负荷聚合商不确定性双重市场 CVaR 投标策略

1

20210425-浙商证券-教育&海外行业周报：鼓励民办教育规范发展，看好高教确定性资产.pdf

2021-04-26 19:03:16 1.39MB 行业咨询

考虑分布式电源不确定性的电力系统多目标优化模型

为了对电力系统经济可靠性的运行进行保证，实现独立运行发电系统分布式电源容量的合理优化配置，充分考虑分布式电源的不确定性，分析电力系统多目标优化模型。此模型基于系统经济型及风险性对分布式电源接入对于配电网的影响进行分析，根据配电网的运行状态调整算法，创建电力系统多目标优化模型。在实现模型求解的过程中，先实现目标函数的无量纲化处理，之后利用混沌变异粒子群算法得到分布式电源最优配置方案。利用算例IEEE-33母线节点系统表示，本文所设计的基于分布式电源不确定电力系统多目标优化模型能够使不同运行状态中优化要求进行满足，对系统运行条件进行改善，从而使系统运行过程中的经济性及安全性得到提高。

2021-04-25 14:54:00 1.55MB 分布式电源； 不确定新； 电力系统； 多目标优化

1

原水投药净化不确定性复杂过程的多模态控制

针对混凝过程难于数学建模实施精准控制,探讨了基于仿人智能的多模态加注投药控制策略.剖析了混凝过程的控制论特性与投药加注过程的控制难点,研究了加注投药的控制策略,结合原水净化站工程实践,提出了多模态的仿人智能控制算法.以二阶时滞过程加注投药控制为例,仿真实验验证了该策略在响应快速性、过程调节时间、稳态控制精度与超调性能等方面的优秀控制品质.仿真研究表明了多模态控制的可行、合理与可用性.

2021-04-22 14:17:32 672KB 原水净化 加注投药 混凝过程 控制策略

1

不确定性决策与强化学习.pdf

2021-04-19 14:07:18 1.93MB 强化学习

1

个人信息

热门下载

最新下载

其他资源