只为小站
首页
域名查询
文件下载
登录
环境动力学已知条件下策略迭代与值迭代的强化学习算法
1. 这是作者花费一周的时间,使用python写出的策略迭代和值迭代强化学习算法,以一个完整的项目发布,为解决“已知马尔科夫决策过程五元组,求最优策略”这类问题提供了算法与通用框架 2. 项目采用面向对象架构和面向抽象编程,用户可以在抽象类基础上,利用继承机制,定义新的具体环境类,测试该算法的有效性。项目还给出了unittest.Testcase的测试代码。 3. 在该项目中算法名称分别对应类:ValueIterationAgent和PolicyIterationAgent(都继承自MdpAgent),马尔科夫决策模型已知的环境抽象类MdpEnv 4. 为展示该算法的有效性,定义了一个GridWorldEnv的具体类,实现了作者博文中“在格子世界中寻宝”的最优策略的学习,并定义了一个GridWorldUI类可视化最优策略及基于最优策略的,用户可以运行住文件main.py 5. 该项目源码的最大特点是:架构合理,可维护性好,可读性强。你不断能学到这两个强化学习算法的精髓,也能够学到什么是好的python程序架构。 6.注意先阅读里面的readme.txt文件。
2024-05-08 21:56:25
329KB
强化学习
策略迭代
面向对象
python
1
信号检测与估值
这是信号检测与估值课后习题答案,是第一章后面的答案,希望对大家有所帮助
2024-05-08 11:28:25
77KB
检测与估值
1
stm32f4单片机上用FFT测量信号频率、幅值等
stm32f4单片机上用FFT测量信号频率、幅值等
2024-05-06 11:29:47
12.11MB
stm32
1
STM32F407(正点原子探索者)+OV2640实现摄像头采集图像灰度化+二值化并显示在屏幕上
所使用的是正点原子探索者开发板,其他同理,改动代码就行,效果详见B站链接https://www.bilibili.com/video/BV1dB4y1k7XN/?spm_id_from=333.999.0.0&vd_source=06d06192a2ff6643ccdab6c1aeae235b
2024-05-05 17:49:30
7.77MB
stm32
图像处理
二值化
1
图像二值化开运算 fpga
开运算就是先进行腐蚀然后进行膨胀,这样操作后可以使得原本连接在一起的区域,变成了不连通的区域。主要针对细小的突起、细的连接线、图像中的弯口、孤立的小块或齿状物体的效果明显
2024-05-05 00:03:31
143.96MB
fpga开发
各种值集定义总结.doc
各种值集定义总结,挺详细的,包括从属值集等
2024-04-30 10:54:18
1.57MB
1
数据结构实验:实现插值和斐波那契查找
所谓查找(Search)又称检索,就是在一个数据元素集合中寻找满足某种条件的数据元素。关于有序表的查找,有折半查找、插值查找、斐波那契查找等,它们的原理和实现方法各有不同,对不同数据的处理也各有优劣。 查找在计算机数据处理中是经常使用的操作。查找算法的效率高低直接关系到应用系统的性能。本次实验是在折半查找的代码基础上,实现插值查找和斐波那契查找,并比较不同的数据这三种方法的查找效率,得出初步结论。
2024-04-28 17:26:46
9.66MB
数据结构
斐波那契查找
插值查找
1
一种高精度压力检测系统温度补偿技术研究
半导体的温度特性会使压阻式压力传感器的零点和灵敏度随温度而发生漂移,是造成压力传感器测量误差的主要因素。对于高精度压力检测系统,温度漂移已成为提高其系统性能的重要障碍,在环境温度变化较大的应用领域更是如此。文章在分析多种温补方法优缺点的基础上,提出了一种结合多项式曲线拟合和三次样条插值的温度补偿方法,可以较好地提高系统性能。
2024-04-28 17:15:09
946KB
压力传感器
温度补偿
曲线拟合
样条插值
1
使用Halcon实现的两点之间线性插值算法,支持多点输入
使用Halcon实现的两点之间线性插值算法,支持多点输入
2024-04-27 16:15:14
4KB
图像处理
Halcon
1
皮尔逊Ⅲ型曲线的离均系数Φ值表完整版.xls
皮尔逊Ⅲ型曲线的离均系数Φ值表完整版.xls
2024-04-18 12:47:28
46KB
皮尔逊Ⅲ型曲线
离均系数
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
2020年数学建模B题穿越沙漠全部代码全国赛二等奖.zip
ChinaMeteorologicalDataHandler.R
pytorch实现RNN实验.rar
java-spring-web-外文文献翻译40篇.zip
模型预测控制MPC(模型预测电流控制,MPCC)的simulink仿真,2016b版本
csma/ca和csma/cd的matlab仿真源代码带有详细的注释
CUDA并行程序设计 GPU编程指南-中文扫描539页完整版pdf+高质量英文完整591页原版非扫描pdf
elsevier 爱思唯尔 系列期刊的word模板,template,单栏,双栏
空间谱估计理论与算法------程序.rar
python实现的学生信息管理系统—GUI界面版
基于Matlab的IEEE14节点潮流计算.zip
简易示波器-精英板.zip
上帝之眼和拾荒者.rar
Plex v7.12电视端app
基于LSTM模型的股票预测模型_python
最新下载
使用微信查看Windows电脑IP给电脑下指令
联想笔记本Y460、Y560通用BIOS,官方正式版27CN71WW。
在Winform中实现带进度条的DataGridView控件
微信ipad协议,微信开发API接口
基于GNU Radio的OFDM通信系统仿真及实测.zip
Lua5.4.3加密完整演示代码
航天飞行器最优控制理论与方法 PDF版电子书
matlab分时代码-DMD_Foreground_Detection:动态模式分解(DMD)用于视频中的前景检测-MATLAB
plist文件裁剪工具.zip
低压 svg 的 MATLAB simulink 仿真
其他资源
探地雷达方法原理及应用
6RD_035_187B_TR7247_SW0317_20190625.zip
pb 获取子文件夹名称
Zigbee CC2530 火焰传感器开发源码
广义互相关计算时延
matlab XPC Target学习资料
FastReport 4.13 完美汉化版本
网页制作作品
jsp+servlet+eclipse+mysql(包含源码和数据库)
现代数字信号处理及其应用解答 何子述
华为s5328c-ei交换机v200r005c00升级包.rar
马尔科夫决策过程的matlab编程实现
TM1639驱动代码
fileTemplates
软件工程(Shari Lawrence Pfleeger著)第4版课后完整版答案
无刷直流电机基础.pdf
spring框架,技术详解及使用指导.pdf.zip
runningApp-源码
双粒子干涉量度学
《产品经理》 The.Internet.Product.Manager.S01E01.第一季第一集.ppt
最新新浪微博爬虫程序Java版 2015
基于深度学习的新型冠状病毒肺炎诊断研究综述
MySql.Data.dll
计算机图形学实现机器人
greensock出品的经典的flash as3 开源类
降维技术matlab工具箱
编译原理语法分析器实验报告.doc版下载
one-wire-ts-input-src-20111026.tar.gz