本书汇集了阿里巴巴一线算法工程师在强化学习应用方面的经验和心得,覆盖了搜索事业部、阿里妈妈事业部、计算平台事业部以及智能服务事业部等多条业务线,工业界首次系统地披露了强化学习在互联网级别的应用上使用的技术细节,其中更包含了阿里巴巴的算法工程师对强化学习的深入理解、思考和创新。 [1] 本书主要面向算法工程师,强化学习方向的研究人员以及所有机器学习爱好者。作为算法工程师,你将了解强化学习在实际应用中的建模方法,常见的问题以及对应的解决思路,提高建模和解决业务问题的能力;作为强化学习方向的研究人员,你将了解到在游戏之外更多实际的强化学习问题以及对应的解决方案,扩宽研究视野;作为机器学习爱好者,你将了解到阿里巴巴的一线机器学习算法工程师是如何发现问题,定义问题和解决问题的,激发研究兴趣以及提升专业素养
2021-06-09 14:34:17 125.67MB 笪庆
1
该书与北京航空航天大学老师张洪钺编写,主要针对最优控制理论,是高等学校工科类研究生教学用书。
2021-06-07 15:39:47 3.44MB 最优控制理论
1
莫烦课程强化学习部分的代码解析,从q-learning算法到ddpg算法,整体代码的思路流程,还有关键部分的详细解释,配套公式详解。
2021-06-07 14:54:36 2.01MB 强化学习
1
强化学习导论英文第二版pdf,源码实现(python)
2021-06-06 15:02:49 4.16MB 强化学习
1
中国科学院大学_强化学习_赵东斌老师_A4纸复习资料,纸质版+PDF打印版
2021-06-06 09:59:58 19.48MB 国科大 RL 复习资料
1
Richard S. Sutton 教授的经典教材《增强学习导论》(Reinforcement Learning: An Introduction)第二版,2018年在线草稿版
2021-06-05 10:33:37 38.03MB 强化学习 Richard S. S
1
增强学习导论 强化学习导论 Reinforcement learning an introduction 中文版
2021-06-05 09:03:57 2.73MB 强化学习导论 Reinforcement introduction
MATLAB实现任意位置出发,自主寻找小球
2021-06-02 09:09:05 2KB MATLAB 强化学习 Qlearning
1
鲁棒控制经典书籍,尽管不太清晰,需要的可以下载,引文版本
2021-06-01 17:08:09 9.83MB 鲁棒 最优控制
1
将非线性系统的最优控制问题导向Hamilton系统,提出了求解非线性最优控制问题的保辛多层次方法.首先,以时间区段两端状态为独立变量并在区段内采用Lagrange插值近似状态和协态变量,通过对偶变量变分原理将非线性最优控制问题转化为非线性方程组的求解.然后,在保辛算法的具体实施过程中提出了多层次求解思想,以2N类算法为基础由低层次到高层次加密离散时间区段,利用Lagrange插值得到网格加密后的初始状态与协态变量作为求解非线性方程组的初值,可提高计算效率.数值算例验证了算法在求解效率与求解精度上的有效性.
2021-06-01 12:03:04 2.17MB 自然科学 论文
1