强学习 标签

强化学习平台天授安装并实现DQN算法

  |   0 评论   |   0 浏览   |   夜雨飘零

天授 是一个基于 PyTorch 的深度强化学习平台。

CartPole-v0 是一个很简单的离散动作空间场景,DQN 也是为了解决这种任务。在使用不同种类的强化学习算法前,您需要了解每个算法是否能够应用在离散动作空间场景 / 连续动作空间场景中,比如像 DDPG [LHP+16] 就只能用在连续动作空间任务中,其他基于策略梯度的算法可以用在任意这两个场景中。