基于鲁棒判别式约束的字典学习算法研究.docx
2021-10-08 23:11:09 78KB C语言
资源其中包括A3C ,DQN ,PPO,概率图论及Sutton强化学习导论的教材等,具有很好的学习价值
2021-10-08 18:49:53 34.01MB Reinforcement le
1
深度模仿学习的语用观察 模仿学习算法(使用PPO ): 美国广播公司 AIRL 公元前 钻头 童话 盖尔 GMMIL nn-PUGAIL PWIL 红色 python main.py --imitation [AIRL|BC|DRIL|FAIRL|GAIL|GMMIL|PUGAIL|RED] 选项包括: 仅状态模仿学习: --state-only 吸收状态指示器 --absorbing R1梯度正则化 :-- --r1-reg-coeff 1 (默认值) 结果 PPO 火车 测试 航空 火车 测试 公元前 火车 测试 钻头 火车 测试 公平 火车 测试 盖尔 火车 测试 吉米 火车 测试 nn-PUGAIL 火车 测试 红色的 火车 测试 致谢 @ikostrikov ( https://github.com/ikostrikov
1
matlab中微多普勒代码mDoppler_thesis 使用模拟微多普勒仪和时频分析结合机器学习算法对人类活动进行分类:汽车用途的比较研究(Chalmers University of Technology University,Gothenburg,Sweden.2017年8月)。 代码和工具。 联络方式 帕维尔·格奥尔吉耶夫(Pavel Gueorguiev)电子邮件:linkedin: 弗雷德里克·阿克塞尔森(Fredrik Axelsson)电子邮件: Matlab代码 freehanddraw.m:一个文件,用于从Matlab中的实际雷达信号中提取微多普勒仪。 用户可以在数据中选择对象运动的方向并提取相关数据,然后应对其进行处理。 人工神经网络 ANN_main.m首先在输入图像上运行深度为1的ANN,然后进行测试。 输入参数是图像大小,网络大小和学习率λ。 此网络不适用于扩展到大于1的深度。 主要的 main.m加载.c3d文件,生成模拟雷达响应,并将STFT,CWD和SPWVD算法应用于信号。 然后将图像保存到文件夹中以备后用。 对于.c3d数据格式,它需要以下支持文件
2021-10-06 12:42:58 22.57MB 系统开源
1
模仿学习基准实施 该项目旨在提供模仿学习算法的清晰实现。 目前,我们已经实现了行为克隆, (带有综合示例),和。 安装: 安装PyPI版本 pip install imitation 安装最新的提交 git clone http://github.com/HumanCompatibleAI/imitation cd imitation pip install -e . 可选的Mujoco依赖性: 请按照说明在安装 。 CLI快速入门: 我们提供了几个CLI脚本作为imitation实现的算法的前端。 这些使用进行配置和复制。 从examples / quickstart.sh中: # Train PPO agent on cartpole and collect expert demonstrations. Tensorboard logs saved in `quickstar
1
是David J.C.MacKay的Information Theory, Inference, and Learning Algorithms(2003年版)对应中文版。
2021-10-04 22:36:13 149.82MB 信息论 贝叶斯 编码 神经网
1
此代码使用迷宫示例演示了强化学习 (Q-learning) 算法,其中机器人必须仅通过向左、向右、向上和向下方向移动才能到达目的地。 在每一步,根据机器人动作的结果,它会被教导和重新教导它是否是一个好的动作,最终整个过程一次又一次地重复,直到它到达目的地。 此时,该过程将再次开始,以便可以验证所学的内容,并且可以忘记在第一遍期间所做的不必要的移动等等。 这是一个很好的教程示例,适用于必须在旅途中进行学习的情况,即不使用训练示例。 可用于游戏中学习和提升AI算法与人类玩家等多种场景的竞争能力。 在小迷宫上收敛会很快,而在大迷宫上收敛可能需要一些时间。 您可以通过修改代码来提高收敛速度,使 Q-learning 高效。 有四个m文件QLearning_Maze_Walk.m - 演示 Q-learning 算法在选定迷宫上的工作Random_Maze_Walk.m - 演示用于比较的随机选
2021-10-04 22:11:13 10KB matlab
1
广告优化:使用强化学习算法(如汤普森采样和上限可信度)来优化最佳广告
1
基于机器学习的恶意代码检测,R语言实现小实验,基础知识讲解
2021-09-30 13:47:59 3.19MB 恶意代码
1