Pytorch 标签

强化学习平台天授安装并实现DQN算法

  |   0 评论   |   0 浏览   |   夜雨飘零

天授 是一个基于 PyTorch 的深度强化学习平台。

CartPole-v0 是一个很简单的离散动作空间场景,DQN 也是为了解决这种任务。在使用不同种类的强化学习算法前,您需要了解每个算法是否能够应用在离散动作空间场景 / 连续动作空间场景中,比如像 DDPG [LHP+16] 就只能用在连续动作空间任务中,其他基于策略梯度的算法可以用在任意这两个场景中。

Pytorch迁移学习

  |   0 评论   |   0 浏览   |   给我丶鼓励

Pytorch 迁移学习。在实践中,很少有人从头开始训练整个卷积网络(使用随机初始化),因为拥有足够大小的数据集相对很少。取而代之的是,通常在非常大的数据集上对 ConvNet 进行预训练(例如 ImageNet,其中包含 120 万个图像,具有 1000 个类别),然后将 ConvNet 用作初始化或固定特征提取器以完成感兴趣的任务。