这个资源是一个包含了使用 PyTorch 实现的11种常见在线强化学习算法的代码集合。每个算法都有独立的文件夹,可以单独运行并测试相应算法在不同环境中的性能。以下是资源中包含的算法: 1、Q-learning 2、SARSA 3、DQN (Deep Q-Network) 4、Double-DQN 5、Dueling-DQN 6、PG (Policy Gradient) 7、AC (Actor-Critic) 8、PPO (Proximal Policy Optimization) 9、DDPG (Deep Deterministic Policy Gradient) 10、TD3 (Twin Delayed DDPG) 11、SAC (Soft Actor-Critic)
2024-03-05 21:19:26 6.68MB pytorch 强化学习 python
1
SAP GUI 750 patch11 第11版补丁修补程序1gui750_11_1-80001468
2024-03-05 10:17:49 139.95MB GUI patc
1
oracle11g帮助文档 .chm格式 版本为11.20.1.0 亲测可用!
2024-03-02 16:51:23 195KB oracle 帮助文档
1
蓝桥杯第十一届第2场省赛代码
2024-03-01 20:20:08 20.36MB 蓝桥杯
1
蓝桥杯第十一届第1场省赛代码
2024-03-01 20:18:51 20.69MB 蓝桥杯
1
STM32F103VCT6TR - High-density performance line ARM-based 32-bit MCU with 256 to 512KB Flash, USB, CAN, 11 timers, 3 ADCs, 13 communication interfaces - STMicroelectronics
2024-03-01 16:59:17 1.66MB
1
HarmonyOS移动开发课程PPT(共11章)
2024-03-01 16:58:49 58.9MB
1
此版本J-Scope安装后选择芯片时不会出现J-Scope闪退问题。
2024-03-01 11:01:59 2.05MB
1
EhLib 10.2.38 CHS For Delphi 11 解压后直接执行Installer里的EhLibInstaller安装
2024-02-29 19:08:43 22.3MB EhLib Delphi
1
详细说明见《Arduino core for the ESP32 安装失败问题处理方法》https://blog.csdn.net/Naisu_kun/article/details/114582503
2024-02-23 09:24:10 801.53MB SDK
1