本课件讲解了强化学习的基本问题,经典Q学习理论,深度Q学习理论和程序讲解与训练。
2022-09-10 19:26:21 2.2MB 强化学习
1
包括reinforcement learning :an introduction,insight+of+RL,Asynchronous Methods for Deep Reinforcement Learning,Playing Atari with Deep Reinforcement Learning,Reinforcement+learning_state+of+the+art等等
2022-09-10 01:14:03 34.83MB 强化学习
1
本文在城市突发事 件发生后待救点事故动态演变的背景下,将应急救 援需求的演变设计成一个马尔可夫决策过程,并构 建优化模型,然后利用花朵授粉算法对模型进行求 解。最后,以某市突发地震灾害,造成药品和食品 短缺为例进行实证研究。结果表明,本文提出的救 援物资需求决策模型使用马尔可夫决策过程方法, 模拟事故演变中待救点物资需求动态变化过程,并 做出合理的需求满足决策,可以合理的配置资源, 使整体救援需求保持平稳的状态,实现了救援需求 的优化,更好的完成救助任务。
2022-09-09 11:06:02 1.78MB 强化学习
1
强化学习基础算法介绍+Pytorch代码(相信我,绝对是你想要的)
2022-09-08 12:14:13 15.6MB 强化学习 pytorch
1
图像是人类感知世界的视觉基础,然而在人类通过视觉获取的大量图像信息中,并不是所有的信息内容都是我们所需要的,所以需要把图像分成若干个特定的、具有独特性质的区域。本文对图像分割方法进行了研究,给出了一种基于模糊逻辑的自适应阈值图像分割方法,并将其应用于车牌图像中,在MATLAB环境下对两幅典型图像通过Otsu方法、脉冲耦合神经网络算法和本文所提算法进行仿真分析,结果对比分析显示本文方法在综合方面略优于其他两种对比方法。
2022-09-07 22:10:48 65KB 图像分割 阈值法 模糊逻辑 matlab
1
静止图像的一种自适应平滑滤波算法.pdf
2022-09-07 14:06:59 97KB
1
Auto RL调研结果;答辩总结
2022-09-07 12:05:15 15.56MB AutoRL
1
基于matlab的带罚函数的自适应粒子群算法+含代码操作演示视频
2022-09-06 15:24:26 191KB matlab 算法 源码软件 自适应粒子群
1.三种不同的RenderMode: Screen Space-overlay, Screen Space-camera, World Space, 在此基础上使用“GetWorldCorners”方法获取到的坐标的意义均不相同 2.使用“RectTransformUtility.ScreenPointToLocalPointInRectangle”,“Camera.xxCamera.ScreenToWorldPoint”等方式在不同空间中的坐标转换
2022-09-06 14:07:10 14.99MB ugui unity ui
1
汉语连续语音识别的语速自适应算法.pdf
1