DQN + HER
该存储库包含DQN + HER的实现。 对提出的玩具问题进行了测试。 这是有关HER的。
此仓库中使用的超参数与本文相同。
:0.001
:0.98
Q-Network是具有256个隐藏单元的MLP
缓冲区最多可容纳 过渡
怎么训练?
python train.py --help
usage: train.py [-h] [-v] [-s S] [-i I] [-e E] [-c C] [-o O]
HER Bit Flipping
optional arguments:
-h, --help show this help message and exit
-v Verbose flag
-s S Size of bit string
-i I Num epochs
-e E
2023-03-27 09:35:47
5KB
Python
1