强化学习平台天授安装并实现DQN算法
天授 是一个基于 PyTorch 的深度强化学习平台。
CartPole-v0 是一个很简单的离散动作空间场景,DQN 也是为了解决这种任务。在使用不同种类的强化学习算法前,您需要了解每个算法是否能够应用在离散动作空间场景 / 连续动作空间场景中,比如像 DDPG [LHP+16] 就只能用在连续动作空间任务中,其他基于策略梯度的算法可以用在任意这两个场景中。
天授 是一个基于 PyTorch 的深度强化学习平台。
CartPole-v0 是一个很简单的离散动作空间场景,DQN 也是为了解决这种任务。在使用不同种类的强化学习算法前,您需要了解每个算法是否能够应用在离散动作空间场景 / 连续动作空间场景中,比如像 DDPG [LHP+16] 就只能用在连续动作空间任务中,其他基于策略梯度的算法可以用在任意这两个场景中。
本项目是一个简单的图像分类应用程序,演示了如何使用 PyTorch Android API。此应用程序在静态图像上运行 TorchScript 序列化的 TorchVision 预训练的 resnet18 模型,该模型作为 Android 资产打包在应用程序内部。
Pytorch 迁移学习。在实践中,很少有人从头开始训练整个卷积网络(使用随机初始化),因为拥有足够大小的数据集相对很少。取而代之的是,通常在非常大的数据集上对 ConvNet 进行预训练(例如 ImageNet,其中包含 120 万个图像,具有 1000 个类别),然后将 ConvNet 用作初始化或固定特征提取器以完成感兴趣的任务。