TensorFlow2中的分布式RL 是一个使用实现各种流行的分布增强学习算法的存储库。 分布式RL是适用于随机环境的算法。 如果您想研究Distribution RL,则此存储库将是最佳选择。 dist-rl-tf2包含由领先的AI研究机构发布的三种Distribution RL算法。 演算法 C51 论文作者Marc G.Bellemare,Will Dabney,RémiMunos 方法OFF政策/时间差异/无模型仅限离散操作 观念的核心 # idea01. The output of the Q Network is a Distribution Vector, not a Scalar Value. def create_model ( self ): input_state = Input (( self . state_dim ,)) h1 = Dens
2023-02-19 23:32:48 458KB machine-learning deep-learning tensorflow dqn
1
使用OpenAI Gym和TensorFlow结合广泛的数学知识来掌握经典RL,深度RL,分布式RL,逆RL等 关于这本书 近年来,随着算法质量和数量的显着提高,《 Python上的动手强化学习》第二版已完全改编为示例丰富的指南,用于学习最新的强化学习(RL)和使用TensorFlow和OpenAI Gym工具包的深度RL算法。 除了探索RL基础知识和基本概念(例如Bellman方程,Markov决策过程和动态规划)之外,第二版还深入探讨了基于价值,基于策略和批评演员的RL方法的全过程,并提供了详细的数学知识。 它深入探索了最新的算法,例如DQN,TRPO,PPO和ACKTR,DDPG,TD3和SAC,从而使基础数学神秘化并通过简单的代码示例演示了实现。 本书有几章专门介绍新的RL技术,包括分布式RL,模仿学习,逆RL和元RL。 您将学习如何利用OpenAI基准库的改进“稳定基准”轻
1
里面是关于tensorflow的python代码,也介绍了深度学习各种网络,以及图片处理
2023-02-18 19:38:34 91.88MB Tensorflow
1
srgan-tensorflow超分辨率图像重建
2023-02-15 21:54:54 14.15MB tensorflow 人工智能 python 深度学习
1
官方代码自动下载的模型,跑得时候一直出问题,重新下载以后就可以运行了。这里打包一下整个工程,备份一波。
2023-02-15 11:03:15 62.78MB tensorflow tensorflowlite posenet 姿态估计
1
【机器学习】安装python的机器学习库scikit-learn、tensorflow-附件资源
2023-02-13 09:38:07 106B
1
tf-gpt-2 使用Tensorflow的GPT-2文本模型的Java库 来源: 更多背景: 基本用法 导入库 < dependency> < groupId>com.simiacryptus < artifactId>tf-gpt-2 < version>1.7.1 实例化文本生成器 import com.simiacryptus.text.TextGenerator ; import com.simiacryptus.text.gpt2.GPT2Util ; TextGenerator textGenerator = GPT2Util . get345M(); 产生文字 System . out . println(textGenerat
2023-02-12 23:48:49 50KB Java
1
欧氏距离matlab代码Tensorflow_Pytorch_Sinkhorn_OT 用于计算两个离散分布之间的最佳运输(OT)距离的Sinkhorn算法[1]的Tensorflow(1.0或2.0)和Pytorch实现。 概述 这些实现是从Cuturi到Tensorflow和Pytorch的改编,它们能够利用其自动差异功能和在GPU上运行的能力。 这些实现并行计算N对离散分布对(即,概率向量)之间的OT距离。 它对应于Cuturi实施中的“ N倍1-vs-1模式”。 输入 a :D_1×N矩阵,每列是D_1维(规格化)概率向量。 b :D_2×N矩阵,每列是D_2维(规格化)概率向量。 M :D_1×D_2矩阵,成本函数正,对角线应为零。 lambda_sh, numItermax, stopThr :算法的参数,与Cuturi的实现相同。 a, b, M是Tensorflow或Pytorch的张量,因此,反向传播适用。 输出 该算法输出一个N维矢量,第n个元素是a[:,n]与b[:,n]之间的(近似)OT距离。 测试 在test.py文件中,提供了Cuturi的Matlab实现与我
2023-02-09 17:49:50 5KB 系统开源
1
用于人类活动识别的深度学习 深度学习可能是人类活动识别最近的未来。 虽然现有的非深度方法有很多,但我们仍然想释放深度学习的全部力量。 这个 repo 提供了一个使用深度学习来执行人类活动识别的演示。 我们同时支持 Tensorflow 和 Pytorch。 先决条件 Python 3.x 麻木 Tensorflow 或 Pytorch 1.0+ 数据集 有许多用于人类活动识别的公共数据集。 您可以参考这篇调查文章以了解更多信息。 在本演示中,我们将使用 UCI HAR 数据集作为示例。 这个数据集可以在找到。 当然,这个数据集在放入网络之前需要进一步的预处理。 我还提供了数据集的预处理版本作为.npz文件,以便您可以专注于网络(在下载)。 还强烈建议您下载数据集,以便您可以自己体验所有过程。 #主题 #活动 频率 30 6 50赫兹 用法 对于 Pytorch(推荐),进入p
1
TensorFlow,李洪金著,深度学习之TensorFlow:入门、原理与进阶实战
2023-02-07 15:24:50 23.94MB TensorFlow
1