矩阵指针Matlab代码L2RPN-使用-A3C 使用 Actor-Critic 框架进行 L2RPN 挑战 ( & ) 的强化学习。 使用此代码训练的代理是挑战的获胜者之一。 代码使用pypownet环境()。 该代码是在 LGPLv3 许可下发布的。 要求 Python >= 3.6 凯拉斯 pypownet 虚拟环境 (conda/venv) 推荐 Pypownet 安装和文档: 文件说明 PDF文件 Amar_L2RPN_IJCNN_git.pdf - 在 IJCNN-2019 的 L2RPN 研讨会上介绍该方法。 总结方法和培训方法中的想法。 Numpy 文件 valid_actions_array_uniq.npz - 有效唯一动作矩阵 valid_actions_masking_subid_perm.npz - 将变电站 Id 映射到用于屏蔽参与者输出的唯一有效动作的矩阵 Python文件 valid_switching_controls.py - 创建上述 numpy 文件的 python 文件 pypow_14_a3c_final.py - 用于使用 A3C 训练演员
2022-05-21 12:56:16 44.1MB 系统开源
1
基于李宏毅课程总结
2022-05-06 10:35:16 599KB PPO RL 强化学习
1
基于李宏毅的课程
2022-05-06 10:33:19 1.05MB PPO RL
1
关于actor-critic的例子,适合初学者对深度强化学习actor-critic的认识和了解
2022-03-22 10:18:59 31KB actor-critic
1
Google趋势搜寻器 Google Trends Scraper是用于从网站提取数据。 目前,它仅抓取随着时间推移的兴趣数据。 它基于构建,您既可以在上也可以在本地运行它。 输入 场地 类型 描述 搜索字词 大批 (如果未提供'spreadsheetId',则为必填。)要抓取的搜索字词列表。 电子表格ID 细绳 (可选)将从中加载搜索字词的Google表格的ID。 isPublic 布尔值 如果选中,则可以导入公共电子表格,而无需授权。 要导入私人表格,请阅读下面的授权书。 默认为false 。 时间范围 细绳 选择预定义的搜索时间范围(默认为“过去12个月”) 类别 细绳 选择一个类别以过滤搜索(默认为“所有类别”) 地缘 细绳 从特定地理位置获取结果(默认为“全球”) maxItems 数字 (可选)要刮取的最大产品数量 customTimeRange 细绳 提供
2022-03-10 14:26:39 27KB JavaScript
1
ga_server 基于protoactor框架的actor游戏服务器
2022-01-21 17:57:53 127KB Go开发-游戏开发
1
Playing Mountain Car Using Actor-Critic MethodPlaying Mountain Car Using Actor-Critic Method
2022-01-15 16:00:19 13KB Playing Mountain
1
NI官网上讲解的《如何快速完成持久耐用之大型专案程式框架》,里面涉及QMH框架和Actor Framework框架。很经典的labview程式架构。
2022-01-15 15:08:58 3.27MB labview Actor Framew QMH
1
unity小游戏源码行动者 Actor Controller - An advanced character controller 0.77C#语言开发。完整的源拿来学习研究很不错也可以可直接运营。
2022-01-10 21:09:41 39.98MB unity小游戏源码行动者Ac