德鲁 无线供电的移动边缘计算网络中在线计算卸载的深度强化学习 使用Python代码重现我们的DROO算法以进行无线供电的移动边缘计算[1],该算法使用随时间变化的无线信道增益作为输入并生成二进制卸载决策。 这包括: :基于实现的WPMEC的DNN结构,包括训练结构和测试结构。 :基于。 :基于实现。 :解决资源分配问题 :所有数据都存储在此子目录中,包括: data _#。mat :训练和测试数据集,其中#= {10,20,30}是用户编号 :针对DROO运行此文件,包括设置系统参数,基于 :基于。 :基于实现。 :当WD的权重​​交替时,运行此文件以评估DROO的性能 demo_on_off.py :当某些WD随机打开/关闭时,运行此文件以评估DROO的性能 引用这项工作 L. Huang,S。Bi和YJ Zhang,“用于无线移动边缘计算网络中在线计算
2021-10-11 17:51:48 24.01MB Python
1
路由 基于强化学习与 MIND 控制器接口的 sdn 路由。 需要 RYU 依赖项。
2021-10-11 15:40:37 12KB Python
1
LQG主动悬架控制随机线性最优控制-LQG主动悬架控制.doc 本帖最后由 slm871213 于 2012-4-27 22:18 编辑 LQG主动悬架控制~ 在研究LQG主动悬架过程中,学习了matlab的基本使用方法和simulink的仿真过程。 供大家贡献学习,讨论。:victory: ——车行南粤的小明哥~新浪围脖
2021-10-11 11:21:12 183KB matlab
1
针对传统小波阈值去噪法中硬阈值函数不连续,软阈值函数有固定偏差的缺点,提出一种新的阈值函数。对Donoho的固定阈值进行改进,提出一种自适应的阈值。在Matlab环境中,分别进行了实验选取最优小波基,新阈值函数的最优参数以及新阈值函数与传统硬阈值函数,软阈值函数和折衷阈值函数的对比。实验结果表明,新的阈值函数能更有效地提高语音信号的信噪比,改进语音质量。
2021-10-11 10:48:52 527KB 论文研究
1
关于论文Deep Reinforcement Learning based Patch Selection for Illuminant Estimation的汇报PPT
2021-10-11 08:56:25 1.67MB 深度强化学习
1
最优化经典教材 清华大学出版社 第一章 数学准备 第二章 便分发及其在最优控制中的应用 第三章 极大值原理 第四章 时间,燃料最优控制 第五章 动态规划 第六章 线性二次型最优调节器 。。。。。。。。
2021-10-09 21:00:29 10.61MB 解学书 最优化
1
快速保真地制备量子态是量子系统的关键问题。 我们提出了两种基于尖端强化学习方法的改进算法,用于在量子自旋系统中从初始状态翻转到目标状态。 探索与开发之间的平衡以及状态空间的大小是强化学习方法的关键因素。 在第一个算法中,我们提出了一种改进的-贪心策略,而不是-贪心策略,以平衡勘探和开发。 此外,我们使用最终状态的保真度作为奖励,并在每个持续时间内利用分段恒定驾驶协议。 结果表明,该算法的校正率大于采用-贪心策略的Q学习。 但是,如果从一个状态到下一个状态的旋转角度太小,仍然会花费大量的时间资源。 因此,我们在第二种改进的Q学习算法(MQL)中初始化状态动作值表以减少状态空间,可以发现学习效率大大提高了。
2021-10-09 17:49:15 252KB Quantum spin -greedy algorithm
1
最优控制理论部分介绍了庞特里亚金最小值原理,并介绍了动态规划和微分对策原理;第二部分介绍了最优控制理论在轨道转移、设计、拦截,交会、对接、返回、再入和航天飞机的指导与控制理论,是航空航天、控制、导航、指导等相关专业的十分好的一本参考书,专业性很强。
2021-10-09 16:53:11 3.7MB 航天 飞行器 最优 理论
1
行业分类-设备装置-基于时间-燃料最优控制的航天器相对轨道转移轨迹优化方法
2021-10-09 13:58:11 940KB
1
李宏毅强化学习ppo算法ppt
2021-10-09 10:43:55 874KB ppo
1