1. 这是作者花费一周的时间,使用python写出的策略迭代和值迭代强化学习算法,以一个完整的项目发布,为解决“已知马尔科夫决策过程五元组,求最优策略”这类问题提供了算法与通用框架 2. 项目采用面向对象架构和面向抽象编程,用户可以在抽象类基础上,利用继承机制,定义新的具体环境类,测试该算法的有效性。项目还给出了unittest.Testcase的测试代码。 3. 在该项目中算法名称分别对应类:ValueIterationAgent和PolicyIterationAgent(都继承自MdpAgent),马尔科夫决策模型已知的环境抽象类MdpEnv 4. 为展示该算法的有效性,定义了一个GridWorldEnv的具体类,实现了作者博文中“在格子世界中寻宝”的最优策略的学习,并定义了一个GridWorldUI类可视化最优策略及基于最优策略的,用户可以运行住文件main.py 5. 该项目源码的最大特点是:架构合理,可维护性好,可读性强。你不断能学到这两个强化学习算法的精髓,也能够学到什么是好的python程序架构。 6.注意先阅读里面的readme.txt文件。
2024-05-08 21:56:25 329KB 强化学习 策略迭代 面向对象 python
1
这是信号检测与估值课后习题答案,是第一章后面的答案,希望对大家有所帮助
2024-05-08 11:28:25 77KB 检测与估值
1
stm32f4单片机上用FFT测量信号频率、幅值等
2024-05-06 11:29:47 12.11MB stm32
1
所使用的是正点原子探索者开发板,其他同理,改动代码就行,效果详见B站链接https://www.bilibili.com/video/BV1dB4y1k7XN/?spm_id_from=333.999.0.0&vd_source=06d06192a2ff6643ccdab6c1aeae235b
2024-05-05 17:49:30 7.77MB stm32 图像处理 二值化
1
开运算就是先进行腐蚀然后进行膨胀,这样操作后可以使得原本连接在一起的区域,变成了不连通的区域。主要针对细小的突起、细的连接线、图像中的弯口、孤立的小块或齿状物体的效果明显
2024-05-05 00:03:31 143.96MB fpga开发
各种值集定义总结,挺详细的,包括从属值集等
2024-04-30 10:54:18 1.57MB
1
所谓查找(Search)又称检索,就是在一个数据元素集合中寻找满足某种条件的数据元素。关于有序表的查找,有折半查找、插值查找、斐波那契查找等,它们的原理和实现方法各有不同,对不同数据的处理也各有优劣。 查找在计算机数据处理中是经常使用的操作。查找算法的效率高低直接关系到应用系统的性能。本次实验是在折半查找的代码基础上,实现插值查找和斐波那契查找,并比较不同的数据这三种方法的查找效率,得出初步结论。
2024-04-28 17:26:46 9.66MB 数据结构 斐波那契查找 插值查找
1
半导体的温度特性会使压阻式压力传感器的零点和灵敏度随温度而发生漂移,是造成压力传感器测量误差的主要因素。对于高精度压力检测系统,温度漂移已成为提高其系统性能的重要障碍,在环境温度变化较大的应用领域更是如此。文章在分析多种温补方法优缺点的基础上,提出了一种结合多项式曲线拟合和三次样条插值的温度补偿方法,可以较好地提高系统性能。
1
使用Halcon实现的两点之间线性插值算法,支持多点输入
2024-04-27 16:15:14 4KB 图像处理 Halcon
1
皮尔逊Ⅲ型曲线的离均系数Φ值表完整版.xls
2024-04-18 12:47:28 46KB 皮尔逊Ⅲ型曲线 离均系数
1