DQN + HER 该存储库包含DQN + HER的实现。 对提出的玩具问题进行了测试。 这是有关HER的。 此仓库中使用的超参数与本文相同。 :0.001 :0.98 Q-Network是具有256个隐藏单元的MLP 缓冲区最多可容纳 过渡 怎么训练? python train.py --help usage: train.py [-h] [-v] [-s S] [-i I] [-e E] [-c C] [-o O] HER Bit Flipping optional arguments: -h, --help show this help message and exit -v Verbose flag -s S Size of bit string -i I Num epochs -e E
2023-03-27 09:35:47 5KB Python
1
后视体验重播(HER) 这是的pytorch实现。 致谢: 要求 python = 3.5.2 openai-gym = 0.12.5(支持mujoco200,但您需要使用Gym> = 0.12.5,它在以前的版本中有一个错误。) mujoco-py = 1.50.1.56( 请使用此版本,如果您使用mujoco200,则可能在FetchSlide-v1中失败) pytorch = 1.0.0(如果使用pytorch-0.4.1,则可能会出现数据类型错误。稍后我将对其进行修复。 ) mpi4py 待办事项清单 支持GPU加速-尽管我添加了GPU支持,但是如果您没有强大的计算机,我仍然不建议您使用。 为每个MPI添加多个环境。 添加FetchSlide-v1的图和演示。 指令运行代码 如果要使用GPU,只需添加--cuda标志(不推荐,最好使用CPU) 。 训练FetchR
2022-12-09 18:35:43 5.35MB reinforcement-learning exploration ddpg her
1
后见之明 Google Chrome / Chromium的互联网历史取证 Hindsight是用于分析Web工件的免费工具。 它从Google Chrome网络浏览器的浏览历史开始,现已扩展为支持其他基于Chromium的应用程序(还有更多应用!)。 Hindsight可以解析许多不同类型的Web工件,包括URL,下载历史记录,缓存记录,书签,自动填充记录,保存的密码,首选项,浏览器扩展,HTTP cookie和本地存储记录(HTML5 cookie)。 从每个文件中提取数据后,会将其与其他历史记录文件中的数据相关联并放置在时间轴中。 它具有一个简单的Web UI-要启动它,请运行“ hindsight_gui.py”(或在Windows上,打包为“ hindsight_gui.exe”),然后在浏览器中访问 : 您需要填写的唯一字段是“配置文件路径”。 这是您要分析的Chrome配置文件的位置(此页面底部列出了不同操作系统的默认配置文件路径)。 点击“运行”,您将被带到结果页面,可将结果保存到电子表格(或其他格式)中。 手动安装 pip install pyhindsight
2021-02-01 14:36:18 36.53MB chrome google-chrome hindsight forensics
1