策略梯度(Policy Gradient, PG)方法的核心思想在于是能获得更好的回报的动作的采样概率不断提高,使获得更少回报的动作的采样概率不断降低,从而达到一个最优的策略。
2022-10-22 09:07:51 7KB libtorch vpg
梯度下降法的简单matlab实现,包含test_gradientdescent.m
2022-10-21 21:28:33 11KB 梯度下降 梯度matlab 梯度下降法
1
【已验证源码】R2021a基于动画演示的梯度下降仿真.zip
2022-10-21 13:08:16 2.66MB MATLAB 动画梯度下降仿真
看我如何让基于支持向量机与方向梯度直方图模式识别系统的设计 与实现.pdf看我如何让基于支持向量机与方向梯度直方图模式识别系统的设计 与实现.pdf看我如何让基于支持向量机与方向梯度直方图模式识别系统的设计 与实现.pdf
1
策略梯度算法PPO+代码解读
2022-10-17 13:05:45 842KB 强化学习 PPO
1
REINFORCE理论+实现代码
2022-10-17 13:05:44 2.12MB 强化学习 REINFORCE 策略梯度 实现代码
1
第6-1课 梯度下降算法原理与编程实现
2022-10-17 13:05:38 1.28MB 梯度下降
1
梯度下降原理与编程实现
2022-10-17 13:05:32 178KB 梯度下降
1
内容涉及多元函数微分学的基本概念、极值和最值、方向导数与梯度、几何学运用。 这是西北工业大学暑假课程老师分享的课件,本人一贯坚持对知识的尊重和对知识共享的支持,设置免费下载。
2022-10-16 22:05:02 1000KB 高等数学 梯度 导数
1
相位梯度自聚焦(PGA)算法广泛应用于合成孔径雷达的运动误差补偿。激光信号波长比微波信号小3~4个数量级,因而在合成孔径激光成像过程中,实验平台的振动会引入极大的相位误差,导致成图质量下降。在合成孔径激光雷达(SAL)成像过程中应用PGA算法,并针对激光波段信号的特点对传统的PGA算法在加窗方法上加以改进。实现了SAL样机在室外64 m成像距离下的快速合成孔径激光成像的实验验证,证明PGA算法能够实现散焦数据中相位误差的精确补偿,且改进后的PGA算法在达到同样补偿效果的前提下,迭代次数更少。
2022-10-11 10:23:15 11.39MB 遥感 合成孔径 相位梯度 成像算法
1