这个资源是一个包含了使用 PyTorch 实现的11种常见在线强化学习算法的代码集合。每个算法都有独立的文件夹,可以单独运行并测试相应算法在不同环境中的性能。以下是资源中包含的算法: 1、Q-learning 2、SARSA 3、DQN (Deep Q-Network) 4、Double-DQN 5、Dueling-DQN 6、PG (Policy Gradient) 7、AC (Actor-Critic) 8、PPO (Proximal Policy Optimization) 9、DDPG (Deep Deterministic Policy Gradient) 10、TD3 (Twin Delayed DDPG) 11、SAC (Soft Actor-Critic)
2024-03-05 21:19:26 6.68MB pytorch 强化学习 python
1
一种基于网格划分的自适应粒子群优化算法.pdf
2024-02-29 19:59:05 323KB 数据结构 参考文献 专业指导
为了提升粒子群优化算法(particle swarm optimization, PSO)的性能,提出了一种基于网格划分的自适应粒子群优化(grid-based adaptive particle swarm optimization, GAPSO)算法和基于网格划分的多样性计算方法,并设计了初始种群多样性最大化(maximal diversity algorithm for the initial swarm,MDAIS)算法。GAPSO分为两个阶段:根据粒子对多样性的贡献自适应调整粒子的进化方向,使种
2024-02-29 19:52:37 327KB 粒子群 网格 多样性 优化算法 惯性权值
1
excel合并后的单元格不能自动调整行高,加载这个“宏”以后可以实现自适应功能。
2024-02-29 14:25:34 13KB excel
1
针对液压支架电液控制系统存在静态软件和动态应用环境之间的矛盾问题,设计了一种液压支架电液控制系统自适应软件。介绍了BP神经网络模型以及自适应控制技术,和液压支架电液控制系统自适应软件工作原理,分析了影响液压支架自动控制的主要因素,提出了液压支架自动控制软件自适应模型,构建了液压支架电液控制系统基于BP神经网络软件自适应模型,介绍了模型训练集样本收集、模型训练相关流程及内容。
2024-02-28 14:38:50 560KB 行业研究
1
为了解决车辆编队控制问题,设计了自适应神经网络编队控制器.在跟随车辆未知领航车辆速度的情况下,根据位置误差、角速度误差和前一时刻跟随车辆的速度,使用神经网络自适应在线调整神经元权重的方法,控制跟随车辆的速度.恰当选择控制器参数,能使跟随误差能足够小.通过六边形队形仿真实验证明了该编队控制器的有效性.该研究结论突破了车辆编队控制中跟随车辆需要已知领航车辆速度的限制,有助于节省速度传感器的使用.
2024-02-27 23:31:04 954KB
1
基于改进自适应谐波检测法的有源电力滤波器,谢锡锋,郑立玲,针对传统自适应谐波检测方法在收敛速度和稳态精度之间存在的矛盾, 提出了一种改进的新型自适应谐波电流检测方法。该方法基于自适�
2024-02-27 23:24:45 313KB 首发论文
1
三速电动机常用于煤矿开采、冶金、造船等工程领域,工作条件恶劣,转子断条是三速电动机的常见故障之一。转子断条故障在线检测中必须考虑电动机实际运行和检测条件。借助三速电动机定子铁芯上嵌放2套或者3套绕组的结构特点,在理论分析、仿真的基础上,提出了基于自适应滤波的三速电动机转子断条在线检测的新方法。仿真和诊断表明该方法可以抑制干扰因素的影响,有效提取故障特征量并实现故障准确诊断,是一种切实可行的在线诊断方法。
1
使用深度强化学习算法实现端到端的无人车避障 使用ROS和gazebo环境下仿真 python脚本编写
2024-02-24 20:12:35 4.42MB python
1
易语言高级表格自适应缩放源码,高级表格自适应缩放
2024-02-24 18:02:57 3KB
1