TensorFlow2中的分布式RL
是一个使用实现各种流行的分布增强学习算法的存储库。 分布式RL是适用于随机环境的算法。 如果您想研究Distribution RL,则此存储库将是最佳选择。 dist-rl-tf2包含由领先的AI研究机构发布的三种Distribution RL算法。
演算法
C51
论文作者Marc G.Bellemare,Will Dabney,RémiMunos 方法OFF政策/时间差异/无模型仅限离散操作
观念的核心
# idea01. The output of the Q Network is a Distribution Vector, not a Scalar Value.
def create_model ( self ):
input_state = Input (( self . state_dim ,))
h1 = Dens
1