然后开始编写人脸识别和人脸注册工具类,使用 insightface.app.FaceAnalysis()
可以获取模型对象,这里包含了三个模型,首先是人脸检测模型,然后是人脸特征提取模型,和最后的性别年龄识别模型。使用 model.prepare()
可以配置 ctx_id
指定使用哪一块 GPU,如果是负数则是使用 CPU 执行预测,nms
配置的是人脸检测的阈值。load_faces()
函数是加载人脸库中的人脸,用于之后的人脸识别对比。
循环神经网络(RNN) 是一类神经网络,其中节点之间的连接形成沿着时间序列的有向图的。这使其能够表现出时间动态行为,使其非常适合时间序列分析,语音识别,语法学习,文字构成等。
Python 是一种非常通用的编程语言,并且由于它的社区和库,您几乎可以做任何您想做的事情,尽管有时您不应该这样做。没有一种语言可以全部统治它们,它们都有优点和缺点,Python 也不例外。
在开始对图像应用霍夫变换之前,我们需要了解霍夫空间是什么,我们将通过示例的方式来学习。
如果您是那种希望尽快入门的男孩(或女孩),则可以跳过本节,直接进入代码。但是为了更好地了解 face-api.js 中用于实现人脸识别的方法,我强烈建议您继续学习,因为我经常被问到这一点。
为简单起见,我们实际上要实现的目标是,识别出具有其面部图像的人,例如 输入图像。我们这样做的方法是为我们要识别的每个人提供一张(或多张)图像,并标上人名,例如参考数据。现在我们将输入图像与参考数据进行比较,找到最相似参考图片。如果两个图像足够相似,我们将输出人名,否则我们输出 '未知'。
听起来像是个计划!但是,仍然存在两个问题。首先,如果我们有一个显示多个人的图像并且我们想要识别所有这些人怎么办?其次,我们需要能够为两个面部图像获得这种相似性度量,以便对其进行比较...
SSD,全称 Single Shot MultiBox Detector,是 Wei Liu 在 ECCV 2016 上提出的一种目标检测算法,截至目前是主要的检测框架之一,相比 Faster RCNN 有明显的速度优势,相比 YOLO V1 又有明显的 mAP 优势。本开源是基于 PaddlePaddle 实现的 SSD,包括 MobileNetSSD,MobileNetV2SSD,VGGSSD,ResNetSSD。使用的是 VOC 格式数据集,同时提供了预训练模型和 VOC 数据的预测模型。
在上一章我们介绍了《双目摄像头测量距离》,在这个基础上,我们来了解如何在 Android 上使用双目测距算法。通过本教程,你不仅掌握如何在 Android 中使用 SBM 等双目测距算法,顺便也了解到如何在 Android Studio 配置 OpenCV,通过使用 OpenCV 可以在 Android 中实现很多图像处理的功能。
在计算机视觉中,可以通过双目摄像头实现,常用的有 BM 算法和 SGBM 算法等,双目测距跟激光不同,双目测距不需要激光光源,是人眼安全的,只需要摄像头,成本非常底,也用于应用到大多数的项目中。本章我们就来介绍如何使用双目摄像头和 SGBM 算法实现距离测量。
本章介绍如何使用 PaddlePaddle 实现简单的声纹识别模型,首先你需要熟悉音频分类,没有了解的可以查看这篇文章《基于 PaddlePaddle 实现声音分类》
。基于这个知识基础之上,我们训练一个声纹识别模型,通过这个模型我们可以识别说话的人是谁,可以应用在一些需要音频验证的项目。
本章介绍如何使用 Tensorflow 实现简单的声纹识别模型,首先你需要熟悉音频分类,没有了解的可以查看这篇文章《基于 Tensorflow 实现声音分类》。基于这个知识基础之上,我们训练一个声纹识别模型,通过这个模型我们可以识别说话的人是谁,可以应用在一些需要音频验证的项目。
本章我们来介绍如何使用 PaddelPaddle 训练一个区分不同音频的分类模型,例如你有这样一个需求,需要根据不同的鸟叫声识别是什么种类的鸟,这时你就可以使用这个方法来实现你的需求了。
本章我们来介绍如何使用 Tensorflow 训练一个区分不同音频的分类模型,例如你有这样一个需求,需要根据不同的鸟叫声识别是什么种类的鸟,这时你就可以使用这个方法来实现你的需求了。话不多说,来干。
目前大部分的手机都有语音助手,例如小米手机的小爱同学,VIVO 的小 V 等等,通过智能助手我们可以快速询一些资讯或者操作手机,例如询问天气,发送微信给你的好友等等。这篇文章就来介绍如何使用 AIUI 快速搭建类似这样的智能助手。
我们在 Android 应用做语音识别的时候,一般是用户唤醒之后开始说话。当用户超过一定的时候没有说话,就停止录音,并把录音发送到语音识别服务器,获取语音识别结果。本教程就是解决如何检测用户是否停止说话,我们使用的是 WebRTC 架构的源代码中的 vad 代码实现的。
这个专栏是深度学习框架 PaddlePaddle Fluid 版本的教程,开发环境主要是 PaddlePaddle 1.6.0 和 Python 3.5。内容涉及了 PaddlePaddle 的安装,并从简单执行 1+1 运算例子入门 PaddlePaddle,借助各个实例一步步入手 PaddlePaddle,通过本系列教程你可以学到如何使用 PaddlePaddle 搭建卷积神经网络,循环神经网络,并能够训练自定义数据集,最后还可以部署到自己的实际项目中。
这个专栏是深度学习框架 PaddlePaddle V2 版本的教程,开发环境主要是 PaddlePaddle 0.11.0 和 Python 2.7。内容涉及了 PaddlePaddle 的安装,并从手写数据集识别入手,借助实例一步步入手 PaddlePaddle,通过实例掌握 PaddlePaddle 的使用,从零进入人工智能领域。
在深度学习中,我们经常会使用到 sigmoid 函数作为我们的激活函数,特别是在二分类上,sigmoid 函数是比较好的一个选择,以下就是 sigmoid 函数的公式:
现在越来越多的手机要使用到深度学习了,比如一些图像分类,目标检测,风格迁移等等,之前都是把数据提交给服务器完成的。但是提交给服务器有几点不好,首先是速度问题,图片上传到服务器需要时间,客户端接收结果也需要时间,这一来回就占用了一大半的时间,会使得整体的预测
我们在第六章介绍了生成对抗网络,并使用生成对抗网络训练 mnist 数据集,生成手写数字图片。那么本章我们将使用对抗生成网络训练我们自己的图片数据集,并生成图片。在第六章中我们使用的黑白的单通道图片,在这一章中,我们使用的是 3 通道的彩色图。
我们在第五章学习了循环神经网络,在第五章中我们使用循环神经网络实现了一个文本分类的模型,不过使用的数据集是 PaddlePaddle 自带的一个数据集,我们并没有了解到 PaddlePaddle 是如何使用读取文本数据集的,那么本章我们就来学习一下如何使用 PaddlePaddle 训练自己的文本数据集。我