上传者: 38540819
|
上传时间: 2021-11-09 17:06:17
|
文件大小: 632KB
|
文件类型: -
贪心算法的matlab程序代码Baxter-Pick-and-Place-using-Q-Learning
Baxter
机器人已经过训练,可以将相似的颜色块组合在一起,然后使用
Q-Learning
将它们堆叠起来
重要先决条件:
Ubuntu
14.04-
ROS
靛蓝
-
安装
OpenCV
3.0-
百特
SDK-
MATLAB-
训练:
Baxter_Training_2.mat
包含受过训练的代理的
Q-Table。
使用
Player.mat
检查训练。
Player.mat
为代理提供了一个随机的数字序列进行排序。
Baxter
上积木的颜色映射到数组中的数字以简化学习过程。
color_3、color_2、color_1分别代表出现3、2、1次的颜色。
color_3、color_2、color_1
mat
文件存储包含
60
种可能状态中每一种的颜色的数组。
它们的使用可以在
Baxter_Training_2.mat
中看到。
代码很简单,使用
Q-Table
实现
Q-Learning。
动作由
epsilon-greedy
算法选择。
训练是针对总共
4^6