蛇艾 当前的项目是游戏Snake的深度强化学习的实现。 范围是显示AI蛇如何学会自己玩游戏。 项目结构 该代码分为以下软件包: game_src :实际游戏的源代码 snake_nn :深度学习实现的源代码 saved_models :训练后保存模型的文件夹。 演示模型包含在此文件夹中 为了清楚起见,存在三个不同的主文件,一个相互独立。 即使这重复了代码,也可以更好地用于项目演示。 每个文件可以单独执行。 main.py-手动播放模式。 它加载游戏并允许用户玩游戏。 main_ai_train.py-为蛇执行训练算法并保存输出模型。 main_ai_replay.py-加载模型并使用模型中的神经网络运行游戏。 项目执行 克隆当前的git仓库。 在执行之前,请确保安装所有来自requirements.txt的依赖项。 pip install -r requirements.txt
2022-03-28 09:08:22 1.44MB Python
1
EasyRL强化学习算法入门与实践.pdf
2022-03-27 21:13:59 1.57MB 解决方案
the option-critic architecture中英文PDF,适合HRL学习,PDF清晰。中文翻译较准确,对照英文论文,理解更容易些
2022-03-26 21:10:29 1.01MB 深度强化学习
1
用于定量金融自动股票交易的深度强化学习库FinRL:用于定量金融自动股票交易的深度强化学习库该存储库引用了我们的论文代码,该代码出现在Deep RL Workshop,NeurIPS 2020中。 DRL)已被认为是量化金融的一种有效方法,动手实践经验对初学者很有吸引力。 但是,要训练一个实际的DRL交易代理,该代理决定在哪里进行交易,以什么价格和什么数量进行交易就容易出错。
2022-03-25 22:15:16 7.74MB Python Deep Learning
1
经典的BayesShrink通过软阈值函数对小波系数进行修正,使得原小波系数和修正小波系数存在恒定偏差,降低了去噪图像质量。文章利用噪声系数幅值随小波系数幅值的增大而相对减小的特点,构造了具有伸缩性的自适应阈值函数,该方法克服了软阈值函数产生的恒定偏差,依赖小波系数幅值对原始系数和修正系数间的恒定偏差自适应调节。伸缩因子m根据不同图像特点采用二分法自适应寻得最优值。实验结果表明改进后的阈值函数相比经典软阈值函数去噪效果较优。
2022-03-25 14:36:53 1006KB 工程技术 论文
1
通过分析研究发现 D.L.Donoho 提出的小波阈值去噪方法,以及文中提及的已构造出的小波阈值函数在图像去噪.方面仍存在问题。为了进一步改善这些问题,综合典型的小波阈值函数的优点与一些改进方法,提出一种改进的新阈值.函数。该阈值函数不仅在阈值处连续,而且含有参数,可通过调整参数来调节阈值化小波系数和原始小波系数之间的恒.定偏差,同时其还具有可微性便于计算。为了突出表现构造的新阈值函数的优越性,通过仿真实验对文中提出的几种小.波去噪方法的均方差(MSE)和峰值信噪比(PSNR)进行对比。实验结果表明,利用新构造的阈值函数去噪,去噪后的图像.无论是视觉效果还是在均方差、峰值信噪比等的性能上都比传统的软、硬阈值和已有的阈值去噪效果好。
1
pytorch-vsumm-reforce 此存储库包含AAAI'18论文的Pytorch实施-。 原始的Theano实现可以在找到。 主要要求是 ( v0.4.0 )和python 2.7 。 和可能未安装在您的计算机中。 请安装其他缺少的依赖项。 开始吧 下载预处理的数据集 git clone https://github.com/KaiyangZhou/pytorch-vsumm-reinforce cd pytorch-vsumm-reinforce # download datasets.tar.gz (173.5MB) wget http://www.eecs.qmul.ac.uk/~kz303/vsumm-reinforce/datasets.tar.gz tar -xvzf datasets.tar.gz 分割 python create_split.py -d da
1
用于初次使用TensorFlow框架搭建深度强化学习网络的人
2022-03-21 20:22:48 274KB 强化学习 TensorFlow
1
马尔科夫决策matlab源码算法交易的强化学习 入门 的Python 3.6.5 我建议创建一个虚拟环境以避免依赖问题。 如果您尚未在当前的python解释器中安装虚拟环境,则可以使用Virtualenv创建虚拟环境。 当前依赖关系在requirements-cpu.txt或gpu等效文件中,可以通过以下命令安装。 pip3 install virtualenv python3 -m virtualenv env source env/bin/activate pip install -r requirements-cpu.txt gpu支持的等效要求在requirements-gpu.txt 。 训练 我们目前正在努力优化两种资产之间的资金分配。 您运行python main.py [source type] ,其中源类型如下: markov 马尔可夫记忆1和固定资产的收益率为0 markov2 马尔可夫记忆2和固定资产的回报率为0 iid IID统一随机变量和固定资产,收益率为0 mix 马尔可夫记忆1和IID统一rv real 真实数据 这将填充Q表的内容,并显示遵循策略的结果,
2022-03-20 19:37:25 19.36MB 系统开源
1
Kuramoto 模型是耦合振荡器的非线性动态系统,最初具有随机的固有频率和相位。 如果耦合足够强,系统将演变为所有振荡器同相的系统。 见克利夫角, https: //blogs.mathworks.com/cleve/2019/10/30/stability-of-kuramoto-oscillators/
2022-03-19 20:16:57 4KB matlab
1