只为小站
首页
域名查询
文件下载
登录
强化学习
程序
用java写的一个
强化学习
程序,猫通过学习学会了抓老鼠
2021-10-22 09:23:06
62KB
强化学习
1
【AIDL】南京大学俞扬博士:
强化学习
前沿【PPT完整版】
南京大学俞扬副教授在第二期《人工智能前沿讲习班》的报告完整PPT,内容包括
强化学习
的概念、主要算法类型和应用等,值得反复精读,目录如下: 一、介绍(Introduction) 二、马尔可夫决策过程(Markov Decision Process) 三、从马尔可夫决策过程到
强化学习
(from Markov Decision Process to Reinforce Learning) 四、
值函数
估计(Value function approximation) 五、策略搜索(Policy Search) 六、游戏中的
强化学习
(Reinforcement Learning in Games) 七、
强化学习
总结 八、
强化学习
资源推荐 第一,
强化学习
到底是什么? 第二,
强化学习
有哪几类算法?这几类算法的思路是什么? 第三,
强化学习
能用在什么地方?应用时会遇到什么限制?
2021-10-21 17:39:31
23.31MB
人工智能
机器学习
强化学习
深度学习
1
最新《智能交通系统的深度
强化学习
》综述论文
最新的技术进步提高了交通运输的质量。新的数据驱动方法为所有基于控制的系统(如交通、机器人、物联网和电力系统)带来了新的研究方向。
2021-10-21 09:55:37
837KB
《智能交通系统的深度强化学习》
1
Reinforcement-Learning-2nd-Edition-by-Sutton-Exercise-Solutions:
强化学习
的解决方案,简介-源码
强化学习
解决方案第二版(Richard S. Sutton的,Andrew G. Barto) 第12章已更新。 有关详细信息,请参见下面的日志。 那些正在使用它来完成您的作业的学生,请停止该作业。 本手册旨在为数百万没有官方指南或适当学习环境的自学人士提供服务。 而且,当然,作为个人项目,它会出现错误。 (如果发现任何问题,则有助于解决问题)。 欢迎来到这个项目。 这是一个很小的项目,我们还没有做太多的编码,但是我们一起合作完成了著名的RL书籍《
强化学习
》(萨顿的介绍)中的一些棘手的练习。 您可能知道这本书,尤其是去年出版的第二版,没有正式的解决方案手册。 如果将答案发送到作者留下的电子邮件地址,则将返回不完整且较旧的伪造答题纸。 那么,为什么我们不写我们自己的呢? 大多数问题都是数学证明,可以很好地学习理论主干,但其中一些是颇具挑战性的编码问题。 两者都将逐渐更新,但数学将排在第
2021-10-21 01:28:13
2.04MB
reinforcement-learning
solutions
self-study
exercise-solutions
1
Covid_Control:机器学习来预测Covid19日用例的未来数量(7天移动平均值)。 牛津数据集的长期短期记忆(LSTM)预测因子和
强化学习
(RL)处方-源码
共视控制 Covid Control是一种免费且可评估的机器学习模型,可预测Covid19日案例(7天移动平均值)的未来数量。 使用LSTM和
强化学习
对非药物干预(NPI)进行量化。 利用机器学习挽救人类史无前例的全球健康能效新型冠状病毒(COVID-19)的生命,以帮助拉平曲线。 开发数据驱动的AI系统以预测感染率并制定区域政府,社区和组织可以实施的干预计划(IP)。 当国家重新开放经济和社会时,干预计划可以减少感染病例,最大程度地减少负面经济影响,并带来更好的结果。 动机:Covid19大流行React 3Blue1Brown的“指数增长和流行病” Covid19视频: 目标是开发一种机器学习模型,以预测未来全球Covid案例的数量: Part1预测器:LSTM长短期记忆预测器模型 使用LSTM长短期记忆以最高的准确性估算未来每天发生的COVID-19病例数,并开发了一种预测器模型
2021-10-18 21:13:45
24.65MB
medical
lstm
lstm-model
modelling
1
模糊
强化学习
用模糊
强化学习
,需预先设定模糊规则,本代码描述了Cartpole学习的
强化学习
过程,有兴趣可以学习一下
2021-10-18 20:00:59
8KB
模糊
强化学习
fuzzy
Qlearning
1
用
强化学习
玩飞翔小鸟-播放Flappy Bird的AI程序.zip
该AI程序实现了多个AI代理来播放Flappy Bird。该计划应用
强化学习
技术,包括SARSA,Q学习和函数逼近。经过10,000次迭代的训练后,特工经常获得1400+的高分,最高游戏得分2069 该项目需要以下框架: Pygame:https://www.pygame.org PyGame学习环境:https://github.com/ntasfi/PyGame-Learning-Environment OpenAI体育馆:https ://gym.openai.com Gy-ple:https : //github.com/lusob/gym-ple PyTorch:https://pytorch.org OpenCV:https://opencv.org
2021-10-16 14:43:06
23KB
AI程序
1
can_work_MADDPG.rar
这是论文《Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments》的pytorch复现,直接使用其开源环境Multi-Agent Particle Environment,运行main.py即可进行运行程序
2021-10-15 09:06:47
1.8MB
MADDPG
多智能体深度强化学习
强化学习
Actor_Critic
神经网络预测python.zip
电信公司评分预测、房价预测、爬虫、共享单车
2021-10-14 21:18:59
71.36MB
强化学习
神经网络
深度学习
1
强化学习
源码(DP, MC, TD, DQN, PG, AC, A3C, DDPG).zip
包括DP, MC, TD, TD-lambda, DQN, PG, AC, A3C, DDPG, Dyna_Q, Bandit, AlphaGoBangZero以及部分仿真游戏源码
2021-10-14 16:17:05
32.58MB
强化学习
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
大学生网页设计大作业-5个网页设计制作作品自己任选
YOLOv5 人脸口罩图片数据集
安卓开发期末大作业----单词本(源码,任务书,大报告,apk文件)(基于andord studio)
中国地面气候资料日值数据集(V3.0)2014-2019.zip
Autojs 例子 源码 1600多个教程源码
quartus II13.0器件库.zip
数字信号处理——保研复习资料.pdf
基于STM32的电子时钟设计
云视通端口扫描器.rar
张正友相机标定Opencv实现(完整程序+棋盘图)实例源码
IBM CPLEX 12.10 学术版 mac操作系统安装包
python大作业--爬虫(完美应付大作业).zip
CNN卷积神经网络Matlab实现
voc车辆检测数据集(已处理好,可直接训练)
代码随想录知识星球精华-大厂面试八股文第二版v1.2.pdf
最新下载
零基础DSP实战TMS320F28035:第十节,DSP之CLA内核应用实战.zip
CLA实现无刷电机控制(可以运行的CODE)
STM32G031C8T6无线温湿度开源项目.rar
ASSA和STW脚本代码解密绿色免费版
MFC西南交大计图实验-2D绘图工具设计
基于FPGA的振动信号采集卡的研究与设计-论文
抓包工具MessageAnalyzer
基于蚁群算法的旅行商问题(TSP)求解(matlab实现)
stm32cubemx软件iic读取mpu6050dmp通过串口1打印欧拉角
A卡560-580原版 bios合集及工具,开核救砖失败专用
其他资源
三层架构--宿舍管理系统
【2019电子版】校招面试题库(附答案与解析)java篇.zip
120多个毕业设计题目及其技术分析。
Android Studio多功能闹钟[android源码]
jsp+sql server 网上商城
基于 matlab 的手势识别系统
S7协议模拟器
JAVA 做的教务管理系统(毕业设计)
vue上传图片到oss的方法示例(图片带有删除功能)
伪原创词库8万条
PlantCARE_24263__plantCARE.tar.gz
简约优雅线条装饰PPT模板.pptx
kubernetes1.15.1.zip
复变函数课后答案.pdf
solaris10 服务进程
易语言源码易语言手机通讯录管理源码.rar
数学建模PPT教程(上)
数据结构课程设计 迷宫求解 源码
计算机图形学—移动的小车
UML网上求职招聘系统
完整EF实例demo
RSM声波透射法分析软件
MIMO通信系统的设计与实现
SM3哈希算法
java中编写车辆管理系统