强化学习对抗攻击和防御 DQN政策 战略定时攻击 统一攻击 对抗训练 该存储库为深度强化学习代理实现了一些经典的对抗攻击方法,包括( drl_attacks/ ): 统一攻击[]。 战略定时攻击[]。 临界点攻击[]。 关键策略攻击。 对抗性政策攻击[]。 也可以使用以下RL防御方法( drl_defenses/ ): 对抗训练[]。 还提供了一些图像防御方法( img_defenses/ ): JPEG转换[]。 位压缩[ ]。 图像平滑[]。 该项目大部分基于基于的RL框架守。 图片敌对攻击和防御都与实施 ,也是基于Pytorch。 相反,A2C和PPO策略基于pytorch-a2c-ppo-acktr-gail ,DQN使用了天守实现。 任何图像对抗攻击都与此项目兼容。 可用型号 它还可以在文件夹log找到适用于不同任务的训练有素的模型。 下表报告了三种
1
基于多智能体的深度强化学习RL的优化OBSS干扰的matlab仿真,matlab2021a测试,深度强化学习训练过程仿真较长。
A practical guide to mastering reinforcement learning algorithms using Keras Key Features: Build projects across robotics, gaming, and finance fields, putting reinforcement learning (RL) into action; Get to grips with Keras and practice on real-world unstructured datasets; Uncover advanced deep learning algorithms such as Monte Carlo, Markov Decision, and Q-learning.
2021-12-26 15:48:39 17.95MB Keras 强化学习 RL Reinforcement
1
多臂赌博机介绍 强化学习入门 Reinforcement Learning
2021-12-23 10:20:44 1.83MB 多臂赌博机 强化学习 RL Reinforcement
1
文字世界 基于文本的游戏生成器和可扩展的沙箱学习环境,用于培训和测试强化学习(RL)代理。 另请访问以获取有关TextWorld及其创建者的更多信息。 对TextWorld有疑问或反馈吗? 将它们发送到或使用上面列出的Gitter频道。 安装 TextWorld需要Python 3,并且目前仅支持Linux和macOS系统。 对于Windows用户,可以将docker用作解决方法(请参阅下面的Docker部分)。 要求 TextWorld的本地组件需要一些系统库。 在基于Debian / Ubuntu的系统上,可以使用以下命令安装它们 sudo apt update && sudo apt install build-essential libffi-dev python3-dev curl git 在macOS上, brew install libffi curl git 注意:我们
1
共视控制 Covid Control是一种免费且可评估的机器学习模型,可预测Covid19日案例(7天移动平均值)的未来数量。 使用LSTM和强化学习对非药物干预(NPI)进行量化。 利用机器学习挽救人类史无前例的全球健康能效新型冠状病毒(COVID-19)的生命,以帮助拉平曲线。 开发数据驱动的AI系统以预测感染率并制定区域政府,社区和组织可以实施的干预计划(IP)。 当国家重新开放经济和社会时,干预计划可以减少感染病例,最大程度地减少负面经济影响,并带来更好的结果。 动机:Covid19大流行React 3Blue1Brown的“指数增长和流行病” Covid19视频: 目标是开发一种机器学习模型,以预测未来全球Covid案例的数量: Part1预测器:LSTM长短期记忆预测器模型 使用LSTM长短期记忆以最高的准确性估算未来每天发生的COVID-19病例数,并开发了一种预测器模型
2021-10-18 21:13:45 24.65MB medical lstm lstm-model modelling
1
资源包含《Reinforcement Learning: An Introduction》两个版本英文pdf/chm电子书和部分翻译资料。
2021-09-17 21:37:15 59.73MB 强化学习 RL Sutton 教程
1
matlab simulink自动代码 simulink_python 使用simulink进行环境的模拟,使用python编写强化学习代码 快速开始 项目简介 tcp通信模块测试 matlab与python之间使用tcp协议进行本地阻塞式通信,matlab接收python端信息后,才能使用simulink进行模拟(目前未解决模拟步长问题)。 尝试将matlab和python分别作为客户端和服务端进行测试。其中,matlab作为客户端模拟100步时间为20s,python作为客户端模拟100步时间为2min。测试代码在。 rl模块测试 使用的是经典的模型 在调bug无果之后,准备先试试这个 尝试项目 项目缺少'svdutilitieslib' matlab,提示install 'Embedded Coder Support Package for ARM Cortex-A Processors,安装完之后发现无法打开matlab 将中文用户名修改为英文之后,问题解决,打开matlab之后发现所安装的模块没起作用,继续安装其他可能有用的模块 在服务器是部署安装matlab 找到了两篇很好
2021-08-30 10:33:59 1.22MB 系统开源
1
Sutton早期开的强化学习课程合集,对强化学习的基础内容讲的比David Silver的课程更详细,更充实
2021-08-13 15:42:21 97.25MB Sutton 强化学习 RL
1
总共178篇,基本涵盖了20年NIps上所有与强化学习相关的文章。 zip压缩包,不要解压密码,261M大小。 看一看顶会论文怎么写的,自己下笔也大概能有个章法,Good Luck! 勤奋决定天分!
2021-07-14 13:18:15 261.61MB 强化学习RL reinforcement learning NIPS2020
1