增强Learning_(ML)_PPO_Microwave滤波器调谐
制造的RF滤波器需要经过滤波器调谐过程,以保证性能而不影响性能
有许多因素,例如繁琐/困难的手动调整过程和过滤器特性,使过滤器调整过程更加复杂
机器学习方法用于缩短滤波器调优过程所花费的时间,提高调优结果的准确性
选择强化学习算法中的近端策略优化(PPO)作为其连续动作空间和连续控制任务中突出的发散速度
强化学习环境:HFSS(由PyCharm中的Python和IronPython脚本自动化)
应用操作后,状态(S 参数的距离)和奖励(距离之和)作为对代理的反馈
强化学习代理:PPO 代理(根据稳定基线 3 文档源代码修改)
代理学习并更新策略以提供要在环境中执行的最佳操作(HFSS 中的筛选器调整过程)
2022-05-11 09:04:20
370KB
算法
源码软件