夜雨飘零 - 首页

WenetSpeech数据集的处理和使用

2021-11-30 270 阅读语音 PaddlePaddle 深度学习语音识别 PaddlePaddle WenetSpeech 普通话语音数据集中文语音数据集

WenetSpeech数据集提供10000+小时的普通话语音，分为强标签（10005小时）、弱标签（2478小时）和无标签（9952小时），用于监督、半监督或无监督训练。数据按领域和风格分组，并提供了不同规模的数据集S、M、L及评估测试数据。教程详细介绍了如何下载、制作并使用该数据集进行语音识别模型的训练，适合ASR系统建设者参考。

阅读全文

基于PaddlePaddle实现的快速人脸识别模型

2021-11-03 234 阅读 PaddlePaddle 深度学习深度学习计算机视觉人工智能

该项目基于ArcFace和PP-OCRv2模型，开发了一个小型高效的人脸识别系统。训练数据集为emore（包含85742个人、5822653张图片），测试则使用lfw-align-128数据集。项目提供完整代码及预处理脚本，通过执行`create_dataset.py`将原始数据整理至二进制文件格式，以提高训练效率。模型训练与评估分别由`train.py`和`eval.py`控制。预测功能支持

阅读全文

基于Pytorch实现的快速人脸识别模型

2021-11-03 194 阅读 Pytorch 深度学习 Pytorch 深度学习人工智能

该项目旨在开发小型模型，高识别准确率且推理速度快的人脸识别系统。训练数据来自emore数据集（582万张图片），测试则使用lfw-align-128数据集。项目结合了ArcFace损失函数和MobileNet，并通过Python脚本实现。训练模型的过程包括数据准备、训练与评估，所有代码可在GitHub上获取。训练模型时，执行`train.py`命令即可开始训练过程；而性能的验证则通过运行`ev

阅读全文

PPASR语音识别（进阶级）

2021-09-18 237 阅读 PaddlePaddle 深度学习语音语音识别深度学习 PaddlePaddle

这个项目是一个基于Kaldi和MindSpore实现的端到端ASR（Automatic Speech Recognition）系统。该系统的架构包括数据收集、预处理、模型训练、评估及预测等多个阶段。下面我将详细解释每个步骤，并提供一些关键信息，帮助你更好地理解这个流程。 ### 1. 数据集项目支持多种数据集，例如AISHELL、Free-Spoken Chinese Mandarin Co

阅读全文

基于Pytorch实现的声音分类

2021-08-20 332 阅读深度学习 Pytorch 语音 Python 人工智能深度学习 Pytorch 声音分类

该代码主要基于PaddlePaddle框架，用于实现一个基于声学特征的语音识别系统。项目结构清晰，包含了训练、评估和预测等功能模块，并且提供了详细的命令行参数配置文件。以下是项目的详细分析及使用说明： ### 1. 项目结构 ``` . ├── configs # 配置文件目录 │ └── bi_lstm.yml ├── infer.py # 声学模型推理代码 ├── recor

阅读全文

基于Pytorch实现的声纹识别模型

2021-07-06 303 阅读深度学习 Pytorch 语音 Pytorch 深度学习声纹识别中文声纹 ArcNet

这个项目展示了如何使用PaddlePaddle框架进行声纹识别，包括了从模型训练到应用部署的多个步骤。以下是对该项目的一些关键点和改进建议： ### 关键点总结 1. **数据准备**：项目中的`prepare_data.py`用于生成包含声纹特征的数据集。 2. **模型设计**：选择了ECAPA-TDNN作为基础模型，并通过自定义配置实现了声纹识别任务。 3. **训练过程**：在`tra

阅读全文

基于Tensorflow2实现的中文声纹识别

2021-07-06 240 阅读 TensorFlow 深度学习语音 Tensorflow 深度学习声纹识别中文声纹识别 ArcFace

这个项目很好地展示了如何使用深度学习模型来进行声纹识别和声纹对比。下面我将对代码进行一些优化、改进，并提供一些建议，以便更好地实现这些功能。 ### 1. 项目结构首先确保项目的目录结构清晰易懂，例如： ``` VoiceprintRecognition/ ├── data/ │ ├── train_data/ │ │ └── user_01.wav │ ├── test_

阅读全文

我的新书，《PaddlePaddle Fluid 深度学习入门与实战》已出版！

2021-06-06 204 阅读深度学习人工智能深度学习 PaddlePaddle 边缘计算自然语言处理

本书详细介绍了如何使用PaddlePaddle进行深度学习开发，涵盖从环境搭建到实际项目应用的全过程。内容包括环境搭建、快速入门、线性回归算法、卷积神经网络与循环神经网络实战、生成对抗网络和强化学习等。此外，还讲解了模型保存与使用、迁移学习以及移动端框架Paddle-Lite的应用等。本书适合初学者入门，并且能够帮助解决实际问题，如花卉类型识别、新闻标题分类等项目。书中所有代码均经过测试，配套资源

阅读全文

基于Pytorch实现人脸关键点检测模型MTCNN

2021-06-02 230 阅读深度学习 Pytorch Pytorch 深度学习人脸识别计算机视觉

MTCNN是一种用于人脸检测的多任务卷积神经网络，由三层网络P-Net、R-Net和O-Net组成。P-Net生成候选窗口；R-Net进行高精度筛选；O-Net输出边界框与关键点。模型采用候选框+分类器思想，并利用图像金字塔、边框回归等技术实现快速高效检测。训练MTCNN分为三步： 1. 训练PNet，生成PNet数据并使用`train_PNet.py`脚本进行； 2. 训练RNet，生成RN

阅读全文

基于MXNET实现的年龄性别识别

2021-04-07 183 阅读深度学习深度学习 mxnet 年龄识别性别识别人脸检测

这个项目是一个基于深度学习的人脸年龄和性别识别系统。它使用了OpenCV、MTCNN（多任务级联卷积网络）进行人脸检测，以及一个预训练的模型来进行年龄和性别的预测。下面我会简要介绍如何运行和理解这些脚本。 ### 1. 环境准备确保你已经安装了必要的Python库： ```bash pip install numpy opencv-python dlib mtcnn ``` ### 2.

阅读全文

基于PaddlePaddle 2.0动态图实现的CRNN文字识别模型

2021-04-03 206 阅读 PaddlePaddle 深度学习深度学习人工智能 PaddlePaddle crnn 文字识别

本文档介绍基于PaddlePaddle 2.0动态图实现的CRNN文字识别模型。该模型通过CNN提取特征，RNN进行序列预测，并使用CTC Loss计算损失，适用于不规则长度图片输入。 **训练与数据准备：** 1. **环境配置**: 需要安装PaddlePaddle 2.0.1和Python 3.7。 2. **数据集生成**: - 使用`create_image.py`脚本自动生成验

阅读全文

基于PaddlePaddle2.0验证码端到端的识别

2021-03-23 213 阅读 PaddlePaddle 深度学习 PaddlePaddle ocr crnn 图像识别深度学习

你的代码已经涵盖了验证码识别项目的大部分内容，包括数据处理、模型训练和推理。以下是对你提供的代码进行的一些改进和完善建议： ### 1. 数据预处理确保图像的尺寸一致（27x72），因为这是你在训练时使用的输入尺寸。 ### 2. 模型定义你的 `Model` 类已经很好地封装了网络结构，但可以进一步优化和添加一些注释以方便理解。 ### 3. 训练过程在训练过程中，确保使用多卡训练时

阅读全文

PPASR中文语音识别（入门级）

2021-03-16 233 阅读 PaddlePaddle 深度学习语音深度学习 PaddlePaddle 人工智能语音识别中文语音识别

感谢你的详细介绍！为了进一步帮助大家理解和使用这个基于CTC的端到端中英文语音识别模型，我将从几个方面进行补充和完善： ### 1. 数据集及其处理 #### AISHELL - **数据量**: 约20小时中文发音。 - **特点**: 包含普通话标准发音和部分方言。 #### Free ST Chinese Mandarin Corpus - **数据量**: 大约65小时中文发音。 -

阅读全文

基于TNN在Android手机上实现图像分类

2020-09-06 200 阅读深度学习 Android 深度学习 Android tnn 图像分类图像识别

这个项目主要是基于TensorFlow Lite的图像分类器，可以实现在Android设备上进行实时图像识别。其主要功能和实现步骤如下： ### 项目结构 - **MainActivity.java**: 主界面实现了图库图片选择及实时摄像头预测。 - **MNNClassification.java**: 集成并封装了MNN模型相关操作。 ### 实现思路 1. **初始化**:

阅读全文

基于MNN在Android手机上实现图像分类

2020-09-05 225 阅读深度学习 Android Android mnn 图像识别 Tensorflow onnx

这是一个关于如何在Android应用中实现图像分类的详细指南。你已经成功地使用了TensorFlow Lite进行图像分类，并展示了如何通过调用相机和选择图片两种方式来获取输入数据，然后将这些数据传递给模型以进行预测。 ### 主要内容总结 1. **初始化模型**：首先加载预训练好的`mobilenet_v2_1.0_224.tflite`模型，并创建一个分类器实例。 2. **读取图片并进

阅读全文

一行代码Android上实现人脸检测、关键点检测、口罩检测

2020-09-05 210 阅读 PaddlePaddle Android 深度学习 Android java 开发语言

本文介绍了使用Paddle Lite在Android应用中实现人脸检测、关键点检测和戴口罩检测的方法。核心代码仅一行，调用`FaceDetectionUtil.getInstance().predictImage(bitmap)`即可完成多项功能。该行代码的背后，涉及模型的训练与编译，包括人脸检测(`pyramidbox.nb`)、人脸关键点检测(`facekeypoints.nb`)及口罩分类(

阅读全文

基于insightface实现的人脸识别和人脸注册

2020-08-30 283 阅读深度学习人脸识别深度学习 mxnet 人工智能 insightface

这个代码实现了一个基于深度学习的人脸识别系统，使用了InsightFace框架。它包含了人脸检测、特征提取和人脸识别的功能，并提供了注册新用户功能。下面是对代码的详细解释： ### 1. 导入必要的库 ```python import cv2 import numpy as np ``` ### 2. 定义 `FaceRecognition` 类这个类包含了所有与人脸识别相关的函数。

阅读全文

Android基于图像语义分割实现人物背景更换

2020-08-29 208 阅读 PaddlePaddle Android PaddlePaddle Android 计算机视觉语义分割

你的项目已经实现了基本的人物图像识别和背景替换功能。为了进一步完善和优化你的代码，我将提供一些改进建议，并给出一些示例代码。 ### 1. 改进预测图像的处理流程在预测结果转换为图片的过程中，可以考虑使用 `Bitmap.createBitmap` 的构造函数直接从数组创建位图，这样可以减少不必要的临时对象创建。此外，在绘制透明背景时可以直接利用 `Canvas` 和 `Paint` 来设置

阅读全文

基于PaddlePaddle实现的目标检测模型PP-YOLOE

2020-08-18 228 阅读 PaddlePaddle 深度学习深度学习人工智能 PaddlePaddle 目标检测计算机视觉

这段文档详细地介绍了如何使用 PaddlePaddle 实现目标检测模型 PP-YOLOE 的训练、评估、导出以及预测过程，并提供了多种部署方式，包括 Inference 预测接口、ONNX 接口和 Android 设备上的预测。以下是对各个部分的总结： ### 1. 训练 - **单卡训练**：使用 `python train.py --model_type=M --num_classes=8

阅读全文

基于Paddle Lite在Android手机上实现图像分类

2020-08-02 228 阅读 PaddlePaddle Android 深度学习 PaddlePaddle Android 图像识别人工智能深度学习

感谢您分享这个基于Paddle Lite进行图像分类的Android应用开发实例。您的项目不仅涵盖了如何从图片中获取类别，还介绍了通过摄像头实时识别图像的方法，这使得用户可以在实际应用场景中快速了解被拍摄物体的信息。下面我将对您提供的内容做进一步优化和补充，并提供一些建议来改进用户体验或提高代码效率： ### 1. 项目结构与资源管理确保项目中的文件结构清晰（如：`assets/image

阅读全文

基于Pytorch实现的流式与非流式语音识别

2020-07-30 274 阅读深度学习 Pytorch 语音 Pytorch 深度学习语音识别卷积神经网络人工智能

### 项目概述该项目是基于PyTorch实现的一个语音识别系统。通过使用预训练的模型和自定义配置，可以对输入的音频文件进行识别并输出相应的文本结果。 ### 安装依赖首先需要安装必要的库。可以在终端或命令行中运行以下命令： ```bash pip install torch torchaudio numpy librosa ``` 如果需要使用语音合成模块，则还需安装`gTTS`和

阅读全文

基于Tensorflow2 Lite在Android手机上实现图像分类

2020-07-22 238 阅读 TensorFlow Android Tensorflow 计算机视觉 Android 图像识别 Tensorflow lite

这个项目主要实现了一个基于TensorFlow Lite的图像分类应用，能够使用Android设备上的摄像头或相册中的图片进行物体识别，并提供实时预测功能。以下是对该项目的核心步骤和关键代码的详细解析： ### 项目结构 - **TFLiteModel**: 包含模型相关配置。 - **MainActivity**: 主界面，用于启动相机或选择图片进行分类。 - **RunClassifier

阅读全文

基于MTCNN和MobileFaceNet实现的人脸识别

2020-07-19 226 阅读深度学习 TensorFlow 人脸识别深度学习 Tensorflow MTCNN MobileFaceNet

你的项目设计了一个基于深度学习的人脸识别系统，并且提供了一个前后端分离的实现。这个系统包括了前端页面和后端服务，可以用来进行人脸注册和实时人脸识别。以下是对你代码的一些详细分析和改进建议： ### 前端部分 1. **HTML模板**: - 你已经在 `templates` 目录下创建了一个简单的 `index.html` 文件，用于提供用户界面。 - 可以添加一些基本的CSS样式

阅读全文

基于Kersa实现的中文语音声纹识别

2020-07-15 196 阅读 TensorFlow 深度学习语音深度学习 Tensorflow Keras 声纹识别说话人识别

感谢你提供的关于声纹识别和对比的详细说明。下面，我将为你提供一个更详细的PaddlePaddle版本的具体实现步骤，并附上代码示例。这个项目将会包括数据预处理、模型训练、声纹对比和注册与识别。 ### 1. 环境搭建首先确保你已经安装了 PaddlePaddle 和其他必要的库，如 `numpy`、`sklearn`等。可以通过以下命令进行安装： ```bash pip install p

阅读全文

基于Pyramidbox实现的大规模人脸检测

2020-07-09 196 阅读 PaddlePaddle 深度学习计算机视觉人工智能深度学习 PaddlePaddle 人脸识别

根据您提供的代码和描述，这是一个基于PyTorch的面部检测模型的实现。该模型使用了自定义的推理过程来加载图像、进行预处理，并通过模型进行人脸检测。以下是对代码的一些关键点总结： - **数据预处理**：将输入图像从`HWC`转置为`CHW`格式，调整色彩空间（BGR到RBG），减去均值并缩放。这一步骤是为了匹配训练时的数据格式。 - **模型推理**：使用PaddlePaddle框架

阅读全文