只为小站
首页
域名查询
文件下载
登录
环境动力学已知条件下策略迭代与值迭代的强化学习算法
1. 这是作者花费一周的时间,使用python写出的策略迭代和值迭代强化学习算法,以一个完整的项目发布,为解决“已知马尔科夫决策过程五元组,求最优策略”这类问题提供了算法与通用框架 2. 项目采用面向对象架构和面向抽象编程,用户可以在抽象类基础上,利用继承机制,定义新的具体环境类,测试该算法的有效性。项目还给出了unittest.Testcase的测试代码。 3. 在该项目中算法名称分别对应类:ValueIterationAgent和PolicyIterationAgent(都继承自MdpAgent),马尔科夫决策模型已知的环境抽象类MdpEnv 4. 为展示该算法的有效性,定义了一个GridWorldEnv的具体类,实现了作者博文中“在格子世界中寻宝”的最优策略的学习,并定义了一个GridWorldUI类可视化最优策略及基于最优策略的,用户可以运行住文件main.py 5. 该项目源码的最大特点是:架构合理,可维护性好,可读性强。你不断能学到这两个强化学习算法的精髓,也能够学到什么是好的python程序架构。 6.注意先阅读里面的readme.txt文件。
2024-05-08 21:56:25
329KB
强化学习
策略迭代
面向对象
python
1
信号检测与估值
这是信号检测与估值课后习题答案,是第一章后面的答案,希望对大家有所帮助
2024-05-08 11:28:25
77KB
检测与估值
1
stm32f4单片机上用FFT测量信号频率、幅值等
stm32f4单片机上用FFT测量信号频率、幅值等
2024-05-06 11:29:47
12.11MB
stm32
1
STM32F407(正点原子探索者)+OV2640实现摄像头采集图像灰度化+二值化并显示在屏幕上
所使用的是正点原子探索者开发板,其他同理,改动代码就行,效果详见B站链接https://www.bilibili.com/video/BV1dB4y1k7XN/?spm_id_from=333.999.0.0&vd_source=06d06192a2ff6643ccdab6c1aeae235b
2024-05-05 17:49:30
7.77MB
stm32
图像处理
二值化
1
图像二值化开运算 fpga
开运算就是先进行腐蚀然后进行膨胀,这样操作后可以使得原本连接在一起的区域,变成了不连通的区域。主要针对细小的突起、细的连接线、图像中的弯口、孤立的小块或齿状物体的效果明显
2024-05-05 00:03:31
143.96MB
fpga开发
各种值集定义总结.doc
各种值集定义总结,挺详细的,包括从属值集等
2024-04-30 10:54:18
1.57MB
1
数据结构实验:实现插值和斐波那契查找
所谓查找(Search)又称检索,就是在一个数据元素集合中寻找满足某种条件的数据元素。关于有序表的查找,有折半查找、插值查找、斐波那契查找等,它们的原理和实现方法各有不同,对不同数据的处理也各有优劣。 查找在计算机数据处理中是经常使用的操作。查找算法的效率高低直接关系到应用系统的性能。本次实验是在折半查找的代码基础上,实现插值查找和斐波那契查找,并比较不同的数据这三种方法的查找效率,得出初步结论。
2024-04-28 17:26:46
9.66MB
数据结构
斐波那契查找
插值查找
1
一种高精度压力检测系统温度补偿技术研究
半导体的温度特性会使压阻式压力传感器的零点和灵敏度随温度而发生漂移,是造成压力传感器测量误差的主要因素。对于高精度压力检测系统,温度漂移已成为提高其系统性能的重要障碍,在环境温度变化较大的应用领域更是如此。文章在分析多种温补方法优缺点的基础上,提出了一种结合多项式曲线拟合和三次样条插值的温度补偿方法,可以较好地提高系统性能。
2024-04-28 17:15:09
946KB
压力传感器
温度补偿
曲线拟合
样条插值
1
使用Halcon实现的两点之间线性插值算法,支持多点输入
使用Halcon实现的两点之间线性插值算法,支持多点输入
2024-04-27 16:15:14
4KB
图像处理
Halcon
1
皮尔逊Ⅲ型曲线的离均系数Φ值表完整版.xls
皮尔逊Ⅲ型曲线的离均系数Φ值表完整版.xls
2024-04-18 12:47:28
46KB
皮尔逊Ⅲ型曲线
离均系数
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
西门子逻辑控制设计开发_3部10层
随机森林用于分类matlab代码
YOLOv5 人脸口罩图片数据集
RX560 bios合集(请务必注意显存品牌和大小以及是否需要6pin!)含刷新工具.zip
科研伦理与学术规范 期末考试2 (40题).pdf
西安问题电缆-工程伦理案例分析.zip
token登录器.rar
android studio课程设计作业PPT+设计文档+可运行源代码+设计思路
Plexim Plecs Standalone 4.1.2 x64.7z
MAC OS.X.10.8.iso 镜像文件
商用密码应用与安全性评估——霍炜.pdf
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
数字图像处理[冈萨雷斯]
银行笔试 信息科技岗部分真题
DS证据理论的MATLAB案例程序源代码
最新下载
基于STM32的武术擂台机器人的设计.pdf
whale的exe可执行文件
谢希仁计算网络思维导图.rar
EXCEL整体写入和读取labview 文件
Pikachu安全靶场通关手册
新时代-等级保护2.0安全解决方案.pdf
等级保护2.0最新解读
python量化交易教程
死锁环路判定的系统资源分配图约简算法的设计与实现
编译opencv4.5.2缺少opencv_videoio_ffmpeg.dll等文件与编译完成的mingw64与mingw32
其他资源
定制对话框标题栏(颜色、按钮等)
chrome 浏览器调用 ocx 插件配套文件
盲源分离JADE算法
IDEA快捷键设置包
MATLAB 曲面拟合
Spring相关的外文文献和翻译(毕设论文必备)
JavaCC实现MiniC语言的编译
FSRCNN-TensorFlow.rar
asp输出json对象实例
04735数据库系统原理 自考 2018 黄靖 课本+习题+答案 OneNote
计算机网络课程设计项目.rar
OpenCV 3.1.0 + opencv_contrib编译后的lib、dll,可直接使用
Android Material Design 各控件demo
erdas LPS 培训手册
javaftp4j实现ftps加密上传
快速锁定主页(方便简单)
中国质量协会的防错设计培训文件-完整中文电子版(75页)
信息隐藏实验报告以及原程序
SublimeCodeIntel插件
模拟电子技术基础》胡宴如_课后答案.
STM32-ARM-实验-1-LED流水灯
触摸按键Layout PCB设计要点
CRC编码的VHDL实现
Nagios系统监控实践(第2版)