这是几篇最新中文深度强化学习综述。综述了深度强化学习的发展历程, 兼论计算机围棋的历史, 阐述了3类主要的深度强化学习方法,包括基于值函数的深度强化学习、基于策略梯度的深度强化学习和基于搜索与监督的深度强化学习;其次对深度强化学习领域的一些前沿研究方向进行了综述,包括分层深度强化学习、多任务迁移深度强化学习、多智能体深度强化学习、基于记忆与推理的深度强化学习等.最后总结了深度强化学习在若干领域的成功应用和未来发展趋势。本文是中文深度强化学习综述,更利于入门学习者理解。
2022-05-15 18:59:29 3.77MB 深度强化学习
1
围棋c++程序 详情观看我的CSDN
2022-05-09 19:16:41 1KB c++
1
人工智能-机器学习-计算机围棋博弈中UCT算法的应用及改进.pdf
2022-05-08 10:06:05 2.91MB 人工智能 机器学习 算法 文档资料
人工智能-机器学习-计算机围棋中的搜索算法研究.pdf
2022-05-08 10:06:05 3.03MB 人工智能 文档资料 机器学习
人工智能-机器学习-计算机九路围棋程序到智能手机的移植.pdf
2022-05-08 09:10:32 3.1MB 人工智能 机器学习 文档资料
经典的2018年的Alphago Zero自我对弈50盘,格式为sgf,需要下载MultiGo之类的棋谱查看软件打开
2022-04-25 14:57:01 81KB Alphago Alphago Zero 围棋
1
该程序是利用stm32f103开发板,在原子哥的例程上开发完成的。 19*19的围棋盘,利用光敏电阻感光电阻的变化,通过多路数据采集光敏电阻的电压值来判断该处的棋子状态,是黑子,还是白子,无子。实现人机下棋并在电脑上实时显示下棋状态,具有很好的学习价值。
2022-04-20 17:23:59 3.29MB stm32 光电围棋 串口 AD采集
1
随着DeepMind公司开发的AlphaGo升级版master战胜围棋世界冠军,其背后应用的强化学习思想受到了广泛关注,也吸引了我想一探究竟为什么强化学习的威力这么大。早在2015年,DeepMind就在youtube上发布了围棋程序master的主要作者David Silver主讲的一套强化学习视频公开课,较为系统、全面地介绍了强化学习的各种思想、实现算法。其一套公开课一共分为十讲,每讲平均为100分钟。其中既包括扎实的理论推导,也有很多有趣的小例子帮助理解,对于理解强化学习来说是一套非常好的教程。我在跟随这套教程学习的过程中一边听讲、一边笔记,最后编写代码实践,终于算是对强化学习的概念终于有了初步的认识,算是入门了吧。为了巩固加深自己的理解,同时也能为后来的学习者提供一些较为系统的中文学习资料,我萌生了把整个公开课系统整理出来的想法。
2022-04-16 14:07:47 2.4MB 算法 学习 深度学习 强化学习
1
去游戏 用 JavaScript 实现围棋游戏
2022-04-09 21:17:35 3KB JavaScript
1
提高自己的围棋水平,测试自己的围棋水平。
2022-04-08 13:43:09 4.56MB 围棋 段位 测试
1