1. 这是作者花费一周的时间,使用python写出的策略迭代和值迭代强化学习算法,以一个完整的项目发布,为解决“已知马尔科夫决策过程五元组,求最优策略”这类问题提供了算法与通用框架 2. 项目采用面向对象架构和面向抽象编程,用户可以在抽象类基础上,利用继承机制,定义新的具体环境类,测试该算法的有效性。项目还给出了unittest.Testcase的测试代码。 3. 在该项目中算法名称分别对应类:ValueIterationAgent和PolicyIterationAgent(都继承自MdpAgent),马尔科夫决策模型已知的环境抽象类MdpEnv 4. 为展示该算法的有效性,定义了一个GridWorldEnv的具体类,实现了作者博文中“在格子世界中寻宝”的最优策略的学习,并定义了一个GridWorldUI类可视化最优策略及基于最优策略的,用户可以运行住文件main.py 5. 该项目源码的最大特点是:架构合理,可维护性好,可读性强。你不断能学到这两个强化学习算法的精髓,也能够学到什么是好的python程序架构。 6.注意先阅读里面的readme.txt文件。
2024-05-08 21:56:25 329KB 强化学习 策略迭代 面向对象 python
1
条件的U网火炬 有条件的U-Net的非官方pytorch实现 消息 此模型的已发布。 安装 conda install pytorch>=1.6 cudatoolkit=10.2 -c pytorch conda install -c conda-forge ffmpeg librosa conda install -c anaconda jupyter pip install musdb museval pytorch_lightning effortless_config tensorboard wandb pydub pip install https://github.com/PytorchLightning/pytorch-lightning/archive/0.9.0rc12.zip --upgrade 评价结果 姓名 control_input_dim control_n
2024-04-23 19:08:24 25KB Python
1
MT447-1995煤矿用电化学式氧气传感器技术条件.pdf
2024-04-20 09:24:00 424KB
1
能量存储是电动汽车的重要方面,而功率转换器在优化功率传输和确保电动汽车的整体性能方面起着至关重要的作用。 在该项目中,提出了一种双向电压源逆变器(VSI)用于功率传输。 该转换器的主要优点在于,无需使用额外的整流器,即可在制动条件下实现超级电容器能量的再生。
2024-04-17 16:14:40 39KB matlab
1
提出了一种在互耦条件下基于酉张量分解的多输入多输出(MIMO)雷达非圆目标稳健的角度估计算法。所提算法首先在张量域利用互耦系数矩阵的带状对称Toeplitz结构来消除未知互耦的影响,然后通过构造一个特殊的增广张量捕获非圆信号的非圆特性与其固有的多维结构特性,并利用增广张量的 centro-Hermitian 特性通过酉变换转化为实值张量,最后利用高阶奇异值分解(HOSVD)获得信号子空间,结合实值子空间技术获得目标的离开方向(DoD)和到达方向(DoA)估计。由于同时利用信号的非圆结构与多维结构特性,所提算法具有比现有的子空间算法更准确的角度估计性能,同时所提算法只需要实值运算,具有较低的运算复杂度。仿真结果表明,所提算法具有有效性与优越性。
2024-04-16 15:52:24 787KB
1
pix2pix 有条件对抗网络的图像到图像翻译的PyTorch实现 纸和官方代码 介绍 Pix2Pix是一个图像到图像的翻译项目,它可以做很多事情,下面仅显示其中一些: 它基于条件GAN,其中条件不是矢量或图像,而是图像。如下所示: 发电机 本文比较了两种不同的生成器,编码解码器和U-Net。 结果表明,U-Net可以做得更好,这可能是因为U-Net具有一些跳过连接,这使您可以更好地了解底层功能。 判别器 本文使用patchGAN作为判别器,这意味着我们不判断整个图像对,而是判断一些图像补丁,然后取平均值。 这样可以加快训练阶段,并可以处理不同大小的图像。 数据集 团队还会发布一些不错的数据集,您可以免费下载。 我将使用城市景观数据集。 您可以下载自己喜欢的数据集并放入数据子目录。 要求 火炬0.4.0 火炬视觉 火 我使用pytorch 0.4.0来构建此项目,因此您需要更新py
2024-04-15 23:08:01 9.42MB Python
1
不同人工干扰条件下枸杞园害虫的风险性评估与防治策略,赵紫华,张蓉,本文建立了枸杞害虫风险评估体系2亚体系、5方面、14个指标的综合评价系统,运用害虫风险指数法与经验公式法对枸杞园主要害虫进行�
2024-03-22 23:51:41 381KB 首发论文
1
南海北部神狐海域钻探获得的水合物中天然气组分以甲烷为主,为典型干气,气体甲烷碳氢同位素组成揭示天然气为典型的生物成因,为二氧化碳还原形成。南海北部地区在硫酸盐一甲烷还原界面(SMI)以下进入生物甲烷生成阶段,盐度适中,适宜产甲烷菌等菌群的生存和生物甲烷气的生成,埋深200~1500 m层段是生物甲烷的主要生成阶段。中新世中晚期、上新世和第四纪沉积物以泥为主,部分层段为砂泥岩互层,有机质丰度较高,类型好,热演化程度低,生物气生成条件优越,可为浅部天然气水合物的形成提供充足的气源。
2024-03-19 09:32:56 713KB 自然科学 论文
1
ISO16750 道路车辆 电气及电子设备的环境条件和试验 ,该标准适用于汽车电气电子系统/组件。对于安装在车辆上/内特定位置的系统/组件描述了可能的环境应力,且规定了试验及要求。包含了一般规定、电气负荷、机械负荷、气候负荷、化学负荷五个部分。
2024-03-17 18:11:19 1.22MB 可靠性标准 汽车可靠性
1
QCT413(2002)汽车电气设备基本技术条件.pdf
2024-03-05 11:13:31 333KB