项目描述: 在该项目中,你将使用强化学习算法,实现一个自动走迷宫机器人。 如上图所示,智能机器人显示在右上角。在我们的迷宫中,有陷阱(红色×××)及终点(蓝色的目标点)两种情景。机器人要尽量避开陷阱、尽快到达目的地。 小车可执行的动作包括:向上走 u、向右走 r、向下走 d、向左走l。 执行不同的动作后,根据不同的情况会获得不同的奖励,具体而言,有以下几种情况。 撞到墙壁:-10 走到终点:50 走到陷阱:-30 其余情况:-0.1 我们需要通过修改 robot.py 中的代码,来实现一个 Q Learning 机器人,实现上述的目标。 Section 1 算法理解 1.1
2022-01-02 17:25:36 473KB ar IN le
1
国外一款很好的寻线车资料,包括路径寻线,之后路径优化寻找最佳路径迅速走到终点。
2021-12-28 15:32:37 8.31MB 走迷宫机器人 黑白线
1
主要介绍了用Q-learning算法实现自动走迷宫机器人的方法示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
2021-11-08 10:58:31 478KB Q-learning 迷宫机器人 Q-learning 迷宫
1
void Senser_reading() { int downfront_temp=0,downleft_temp=0,downright_temp=0; int upfront_temp=0,upleft_temp=0,upright_temp=0; int balance_temp=0,balance_right_temp=0; int loop; for(loop=0;loop<100;loop++) { if(IORD_ALTERA_AVALON_PIO_DATA(DOWNFRONT_BASE)) downfront_temp++; if(IORD_ALTERA_AVALON_PIO_DATA(DOWNLEFT_BASE)) downleft_temp++; if(IORD_ALTERA_AVALON_PIO_DATA(DOWNRIGHT_BASE)) downright_temp++; if(IORD_ALTERA_AVALON_PIO_DATA(UPFRONT_BASE)) upfront_temp++; if(IORD_ALTERA_AVALON_PIO_DATA(UPLEFT_BASE)) upleft_temp++; if(IORD_ALTERA_AVALON_PIO_DATA(UPRIGHT_BASE)) upright_temp++; if(IORD_ALTERA_AVALON_PIO_DATA(BALANCE_BASE)) balance_temp++; if(IORD_ALTERA_AVALON_PIO_DATA(BALANCE_RIGHT_BASE)) balance_right_temp++; } switch(downfront_temp)
2021-10-18 15:29:17 3KB 走迷宫机器人C++源码
1