上传者: 42349855
|
上传时间: 2021-10-25 16:29:28
|
文件大小: 2KB
|
文件类型: -
简单的强化学习的C++模拟。
强化学习是机器学习的一个重要分支,是多学科多领域交叉的一个产物,它的本质是解决 decision making 问题,
即自动进行决策,并且可以做连续决策。
它主要包含四个元素,agent,环境状态,行动,奖励, 强化学习的目标就是获得最多的累计奖励。
简单来说,在结点0下有结点1和结点2两个分支,以此类推,在结点1,2和下依旧有两个结点3,4和5,6;总共有4层结点,
总共15个结点,而我们的目标是最后一个结点,也就是对走到最会一个结点的运行状态进行奖励。