《PaddlePaddle从入门到炼丹》十二——自定义文本数据集分类
我们在第五章学习了循环神经网络,在第五章中我们使用循环神经网络实现了一个文本分类的模型,不过使用的数据集是 PaddlePaddle 自带的一个数据集,我们并没有了解到 PaddlePaddle 是如何使用读取文本数据集的,那么本章我们就来学习一下如何使用 PaddlePaddle 训练自己的文本数据集。我
我们在第五章学习了循环神经网络,在第五章中我们使用循环神经网络实现了一个文本分类的模型,不过使用的数据集是 PaddlePaddle 自带的一个数据集,我们并没有了解到 PaddlePaddle 是如何使用读取文本数据集的,那么本章我们就来学习一下如何使用 PaddlePaddle 训练自己的文本数据集。我
本章将介绍如何使用 PaddlePaddle 训练自己的图片数据集,在之前的图像数据集中,我们都是使用 PaddlePaddle 自带的数据集,本章我们就来学习如何让 PaddlePaddle 训练我们自己的图片数据集。
VisualDL 是一个面向深度学习任务设计的可视化工具,包含了 scalar、参数分布、模型结构、图像可视化等功能。可以这样说:“所见即所得”。我们可以借助 VisualDL 来观察我们训练的情况,方便我们对训练的模型进行分析,改善模型的收敛情况。
在深度学习训练中,例如图像识别训练,每次从零开始训练都要消耗大量的时间和资源。而且当数据集比较少时,模型也难以拟合的情况。基于这种情况下,就出现了迁移学习,通过使用已经训练好的模型来初始化即将训练的网络,可以加快模型的收敛速度,而且还能提高模型的准确率。这
本系列教程中,前面介绍的都没有保存模型,训练之后也就结束了。那么本章就介绍如果在训练过程中保存模型,用于之后预测或者恢复训练,又或者由于其他数据集的预训练模型。本章会介绍三种保存模型和使用模型的方式。
本章介绍使用 PaddlePaddle 实现强化学习,通过自我学习,完成一个经典控制类的游戏,相关游戏介绍可以在 Gym 官网上了解。我们这次玩的是一个 CartPole-v1
游戏,操作就是通过控制滑块的左右移动,不让竖着的
我们上一章使用 MNIST 数据集进行训练,获得一个可以分类手写字体的模型。如果我们数据集的数量不够,不足于让模型收敛,最直接的是增加数据集。但是我们收集数据并进行标注是非常消耗时间了,而最近非常火的生成对抗网络就非常方便我们数据的收集。对抗生成网络可以根据之前的
除了卷积神经网络,深度学习中还有循环神经网络也是很常用的,循环神经网络更常用于自然语言处理任务上。我们在这一章中,我们就来学习如何使用 PaddlePaddle 来实现一个循环神经网络,并使用该网络完成情感分析的模型训练。
上一章我们通过学习线性回归例子入门了深度学习,同时也熟悉了 PaddlePaddle 的使用方式,那么我们在本章学习更有趣的知识点卷积神经网络。深度学习之所以那么流行,很大程度上是得益于它在计算机视觉上得到非常好的效果,而在深度学习上几乎是使用卷积神经网络来提取图像的特征
在第二章,我们已经学习了如何使用 PaddlePaddle 来进行加法计算,从这个小小的例子中,我们掌握了 PaddlePaddle 的使用方式。在本章中,我们将介绍使用 PaddlePaddle 完成一个深度学习非常常见的入门例子——线性回归,我们将分别使用自定义数据集和使用 PaddlePaddle 提供的数据集接口来训练一个线性回归模型。
在第一章介绍了 PaddlePaddle 的安装,接下来我们将介绍如何使用 PaddlePaddle。PaddlePaddle 是百度在 2016 年 9 月 27 日开源的一个深度学习框架,也是目前国内唯一一个开源的深度学习框架。PaddlePaddle 在 0.11.0 版本之后,开始推出 Fluid 版本,Fluid 版本相对之前的 V2 版本,Fluid 的代码结构
这一章我们介绍如何安装新版本的 PaddlePaddle,这里说的新版本主要是说 Fluid 版本。Fluid 是设计用来让用户像 Pytorch 和 Tensorflow Eager Execution 一样执行程序。在这些系统中,不再有模型这个概念,应用也不再包含一个用于描述 Operator 图或者一系列层的符号描述,而是像通用程
问题:计算每层网络结构和输入输出尺寸和参数个数。不加 BN?更深?每层的尺寸变化?更多结构?
本项目是基于 PaddlePaddle 的 DeepSpeech 项目开发的,做了较大的修改,方便训练中文自定义数据集,同时也方便测试和使用。DeepSpeech2 是基于 PaddlePaddle 实现的端到端自动语音识别(ASR)引擎,其论文为《Baidu’s Deep Speech 2 paper》 ,本项目同时还支持各种数据增强方法,以适应不同的使用场景。
前一章我们已经介绍了常见的人脸数据集,在本章将要进行人脸识别的第二步人脸检测。在人脸识别任务中,首先是需要检查一张图片中是包含有人脸,然后把这个人脸裁剪出来,然后使用脸部的关键点进行人脸对齐,最后使用人脸对比方式完成人脸识别。
开发人脸识别系统,人脸数据集是必须的。所以在我们开发这套人脸识别系统的准备工作就是获取人脸数据集。本章将从公开的数据集到自制人脸数据集介绍,为我们之后开发人脸识别系统做好准备。
中央民族大学创业团队巨神人工智能科技在科赛网公开了一个 TibetanMNIST 正是形体藏文中的数字数据集,TibetanMNIST 数据集的原图片中,图片的大小是 350*350
的黑白图片,图片文件名称的第一个数字就是图片的标签,如 0_10_398.jpg
这张图片代表的就是藏文的数字 0。在本项目中我们结合第四章所学的卷积神经网络,来完成 TibetanMNIST 数据集的分类识别。
TensorFlow Lite 是一款专门针对移动设备的深度学习框架,移动设备深度学习框架是部署在手机或者树莓派等小型移动设备上的深度学习框架,可以使用训练好的模型在手机等设备上完成推理任务。这一类框架的出现,可以使得一些推理的任务可以在本地执行,不需要再调用服务器的网络接
Caffe 是目前比较常用的深度学习框架,这个框架安装没有其他一下主流框架那么简单,直接使用 pip 命令安装,它更常用的是使用编译的方式安装。所以写下这个文章记录一下。