使用奇异值分解的人脸识别。 该识别算法使用基本对象识别方法,即奇异值分解。 使用SVD函数,您可以训练自己的图像并在该图像上执行SVD,然后可以对SVD函数返回的U(特征脸)向量进行一些数学运算测试。 面部图像的数据集在“ dataimage”中。 该代码显示在face_recognition.py文件中。 测试图像位于test_img文件夹中。达到的准确度为85%。
2021-09-13 10:20:50 280KB python opencv face-recognition svd
1
使用Tensorflow识别交通标志 这是一个由多部分组成的教程,用于使用Tensorflow构建交通标志识别模型。 这是一个正在进行的工作。 包括第1部分。 第2部分和第3部分正在开发中。
2021-09-11 15:06:44 4.97MB JupyterNotebook
1
Pytorch 上的端到端语音识别 基于 Transformer 的语音识别模型 如果您在工作中使用了本工具包中包含的任何源代码,请引用以下论文。 Winata,GI,Madotto,A.,Wu,CS,&Fung,P.(2019年)。 使用来自并行句子的基于神经的合成数据的代码切换语言模型。 在第23届计算自然语言学习会议(CoNLL)的会议记录中(第271-280页)。 Winata, GI, Cahyawijaya, S., Lin, Z., Liu, Z., & Fung, P. (2019)。 使用 Low-Rank Transformer 的轻量级和高效的端到端语音识别。 arXiv 预印本 arXiv:1910.13923。 (被ICASSP 2020接受) Zhou, S., Dong, L., Xu, S., & Xu, B. (2018)。 使用 Transfor
2021-09-05 18:50:50 106KB end-to-end speech pytorch transformer
1
情绪识别 该存储库的目的是通过深度学习探索面部表情识别 环境: python 2.7 pytorch 0.3.0 GTX 1080 楷模: VGG Face微调可用于基于图像的表情识别 VGG + GRU用于基于视频的表情识别 Resnet + GRU用于基于视频的表情识别 型号详情: VGG Face 我们使用进行微调,使用FER2013数据集进行分类。 首先,我们通过将caffe模型转换为Pytorch模型,我们提供了转换后的。FER2013数据库包含35889张图像:用于培训的28709张图像,用于公共测试的3589张图像,以及用于私人测试的3589张图像。 我们使用训练数据和公共测试数据进行训练,并使用私人测试数据评估模型性能。 在这里,我们提供已 用法: 首先下载FER2013数据集(需要解压缩)和pytorch模型(VGG_Face_torch
2021-09-02 20:00:37 24KB emotiw vgg-face video-based Python
1
滑块本地识别源码,只用了精易模块无其他任何模块/支持库 识别率速度还可以
2021-09-01 13:25:51 256KB 网络相关源码
1
言语情感识别 卷积递归神经网络的TensorFlow在IEMOCAP数据库上的语音情感识别(SER)实现。为了解决帧情感标签不确定性的问题,我们执行了三种合并策略(最大合并,均值合并和基于注意力的合并)加权池)以生成SER的发声级功能。 这些代码仅在带有GTX-1080 GPU的ubuntu 16.04(x64),python2.7,cuda-8.0,cudnn-6.0上进行过测试。要在计算机上运行这些代码,您需要安装以下依赖项: 张量流1.3.0 python_speech_features 波 cPickle 麻木 斯克莱恩 操作系统 演示版 要运行演示,请在分叉存储库之后,运行以
1
这是一款用于在Unity中基于OpenCV的识别脸部特征的插件,支持包含iOS、Android及WindowsPhone 8.1在内的移动平台以及PC端与WebGL平台。Dlib FaceLandmark Detector能够检测2D纹理、WebCamTexture以及图片中正面出现的人脸,并可以利用68个顶点来标记脸部轮廓。此外,该插件还提供了强大的机器学习算法,对训练数据进行一些调整即可用于检测不同类型的对象,如动物脸部特征等。
2021-08-31 14:09:14 140.02MB 人脸识别
1
姿态归一化图像生成用于人员重新识别 在当前版本中,我们发布了PN-GAN和re-id测试代码。 我们项目的其他部分将在以后发布。 框架: 准备数据: 请下载reID数据集并按以下方式进行组织(例如,Market-1501): dataset │── Market-1501 # for Market-1501 dataset │ ├── bounding_box_train │ ├── bounding_box_test │ ├── query | ├── bounding_box_train_pose # containing training pose images generated by AlphaPose or OpenPose | ├── bounding_b
2021-08-31 09:28:22 6.89MB MATLAB
1
全身检测 人脸检测 眼睛检测 微笑检测 上半身检测 下半身检测 人脸识别源码,APP人脸识别
2021-08-28 19:22:23 109.98MB 人脸识别
1
RNN-换能器语音识别 在Tensorflow 2.0中使用RNN-Transducer进行端到端语音识别 概述 该语音识别模型基于Google的研究论文,并使用Tensorflow 2.0在Python 3中实现。 设置您的环境 要设置您的环境,请运行以下命令: git clone --recurse https://github.com/noahchalifour/rnnt-speech-recognition.git cd rnnt-speech-recognition pip install tensorflow==2.2.0 # or tensorflow-gpu==2.2.0 for GPU support pip install -r requirements.txt ./scripts/build_rnnt.sh # to setup the rnnt loss 共同的
1