搜索【openai】的结果

【AI论文和代码2021年】Zero-Shot_Text-to-Image Generation from OpenAI

OpenAI 成功训练了一个能够从文本标题生成图像的网络。它与 GPT-3 和 Image GPT 非常相似，并产生了惊人的结果。

2021-11-25 20:02:04 9.13MB ai ieee论文 代码复现

MPE-Multiagent-RL-Algos:使用OpenAI MPE环境的多主体RL的简单验证实验代码-源码

MPE-多主体强化学习算法 MPE 这是使用OpenAI Multi-Agent RL的简单验证实验代码。该环境总结了许多基准，并最初为算法做准备。由于环境设置简单， MPE似乎是验证我们新的Multi-Agent RL算法并与其他基准进行比较的良好玩具实验环境。我为您编写了一些著名的多主体RL算法，以便您可以更改较少的代码来实现自己的算法并验证实验结果。笔记：如果要成功运行此MPE环境，则必须确保已下载。但是，我已经将基准的文件推送到项目中，如果您发现从OpenAI下载的基准有任何问题，则可以使用我的文件。要求 Python> = 3.6.0 PyTorch == 1.2.0 OpenAI体育馆== 0.10.5 演算法待办事项清单评估和渲染数字与比较上传训练模型.pt 致谢我一直以硕士生的身份学习。我的代码和对算法的理解可能存在一些问

2021-11-23 10:03:43 3.62MB Python

1

PPO-Keras:Keras实施PPO解决OpenAI体育馆环境-源码

PPO-Keras Keras实施PPO解决OpenAI体育馆环境

2021-11-14 18:28:22 4KB Python

1

openAI gym配套的软件包。

安装openAI的gym进行强化学习时，经常会遇到需要安装Box2D的情况，本资源为其Linux（Ubuntu）下的源码安装包。

2021-11-08 22:48:58 1.39MB gym pyBox2D 源码安装

1

flappy-bird-gym：Flappy Bird游戏的OpenAI Gym环境-源码

OpenAI体育馆的飞扬的小鸟该存储库包含用于Flappy Bird游戏的OpenAI Gym环境的实现。它基于的。当前，环境为代理提供以下观察参数：鸟的y位置；鸟的垂直速度；到下一个管道的水平距离；下一个管道的y位置。将来，我还打算实现一个环境版本，该版本将提供代表游戏屏幕的图像作为观察结果。安装要安装flappy-bird-gym ，只需运行以下命令： $ pip install flappy-bird-gym 用法像在其他gym环境中一样，使用flappy-bird-gym非常容易。只需导入包并使用make函数创建环境。看下面的示例代码： import time import flappy_bird_gym env = flappy_bird_gym.make("FlappyBird-v0") obs = env.reset() while

2021-11-02 15:24:42 6.5MB game machine-learning reinforcement-learning flappy-bird

1

Python-OpenAI对GPT2WebText数据集的开放式克隆

OpenAI对GPT-2 WebText数据集的开放式克隆

2021-10-29 19:02:38 14KB Python开发-自然语言处理

1

gym-duckietown:Duckietown宇宙的自动驾驶汽车模拟器-源码

Gym-Duckietown 于OpenAI Gym的自动驾驶汽车模拟器环境。如果要在出版物中引用此存储库，请使用此bibtex： @misc{gym_duckietown, author = {Chevalier-Boisvert, Maxime and Golemo, Florian and Cao, Yanjun and Mehta, Bhairav and Paull, Liam}, title = {Duckietown Environments for OpenAI Gym}, year = {2018}, publisher = {GitHub}, journal = {GitHub repository}, howpublished = {\url{https://github.com/duckietown/gym-duckietown}},

2021-10-28 17:10:43 8.88MB simulator reinforcement-learning robot openai-gym

1

pytorch-LunarLander:OpenAI Gym中针对LunarLander-v2环境的不同Deep RL算法的PyTorch实现-源码

pytorch-LunarLander OpenAI Gym中针对LunarLander-v2环境的不同Deep RL算法的PyTorch实现我们实施了3种不同的RL算法来解决LunarLander-v2环境：模仿学习加强优势-演员-批评（A2C）注意：模仿学习是在Keras中实现的，另外两种算法是在PyTorch中实现的指示：安装所有依赖项克隆仓库运行以下命令： 3.1）python imitation.py 3.2）python reinforce.py 3.3）python a2c.py

2021-10-26 18:58:14 14KB Python

1

GPT2:OpenAI GPT-2的PyTorch实施-源码

GPT-2 PyTorch实施目录介绍该项目是OpenAI GPT-2模型的PyTorch实现。它提供模型训练，句子生成和量度可视化。它被认为是可以理解和优化的。我们设计的代码易于理解。另外，我们使用来提高性能。依存关系正则表达式 tqdm 火炬麻木 matplotlib 用法怎么训练？在训练GPT-2模型之前，应准备语料库数据集。我们建议使用构建自己的语料库。相反，训练模块需要带有词汇表文件的标记化训练和评估数据集。准备数据集后，可以使用以下方法训练GPT-2： $ python -m gpt2 train --train_corpus build/corpus.train.txt \ --eval_corpus build/corpus.test.txt \

2021-10-20 16:50:37 153KB nlp natural-language-processing pytorch transformer

1

MPC:神经网络动力学，用于基于模型的深度强化学习，且无模型精调-源码

从数据中学习动力系统神经网络动力学，用于基于模型的深度强化学习，且无模型精调

2021-09-25 10:05:10 2.24MB reinforcement-learning openai-gym model-predictive-control Python

1

个人信息

热门下载

最新下载

其他资源