多任务学习专家 注意:从0.4.0开始,tf版本必须大于等于2.1。 安装 pip install bert-multitask-learning 它是什么 这个项目使用变压器(基于拥抱面部变压器)进行多模式多任务学习。 我为什么需要这个 在原始的BERT代码中,多任务学习或多GPU训练都不可行。 另外,该项目的初衷是NER,它在原始BERT代码中没有有效的脚本。 总而言之,与原始bert回购相比,此回购具有以下功能: 多模式多任务学习(重写大部分代码的主要原因)。 多GPU训练 支持序列标记(例如NER)和Encoder-Decoder Seq2Seq(带变压器解码器)。 支持哪些类型
1
该工程代码是实现一个摄像头类,通过摄像头在之前的窗口中一直显示画面,同时显示时间日期以及关闭摄像头画面功能。
2021-10-21 17:50:28 12KB Face_Recognition 人脸检测 Qt Pycharm
1
虹膜识别-PyTorch 使用PyTorch的端到端虹膜识别。 安装 准备用于设置虚拟环境的工具(如果已经完成,请跳过它): sudo apt-get install -y python-pip python3-pip cmake mkdir ~/.virtualenvs cd ~/.virtualenvs sudo pip install virtualenv virtualenvwrapper sudo pip3 install virtualenv virtualenvwrapper echo "# virtualenv and virtualenvwrapper" >> ~/.bashrc echo "export WORKON_HOME=$HOME/.virtualenvs" >> ~/.bashrc echo "export VIRTUALENVWRAPPER_PYTHON
2021-10-21 17:17:29 1.01MB Python
1
介绍 我们发布了用于在UCF101上微调I3D模型的完整代码(包括培训阶段和测试阶段)。 I3D论文: 。 有关I3D的模型和详细信息,也请参考i3d。 先决条件 软件 Ubuntu 16.04.3 LTS Python 2.7 CUDA8 CuDNN v6 Tensorflow 1.4.1 硬件 GTX 1080 Ti 怎么跑 1.克隆此仓库 git clone https://github.com/USTC-Video-Understanding/I3D_Finetune 2.下载动力学预训练的I3D模型 为了在UCF101上微调I3D网络,您必须在下载DeepMind提供的Kinetics预训练I3D模型。 具体来说,下载repo并将data/checkpoints文件夹放入我们的I3D_Finetune回购的data I3D_Finetune : git clone ht
1
CelebAMask-HQ CelebAMask-HQ是一个大规模的面部图像数据集,通过遵循CelebA-HQ从CelebA数据集中选择了30,000张高分辨率面部图像。 每个图像具有对应于CelebA的面部属性的分割蒙版。 CelebAMask-HQ口罩采用512 x 512尺寸手动注释,分为19类,包括所有面部组件和配件,例如皮肤,鼻子,眼睛,眉毛,耳朵,嘴巴,嘴唇,头发,帽子,眼镜,耳环,项链,脖子和布。 CelebAMask-HQ可用于训练和评估人脸解析,人脸识别以及用于人脸生成和编辑的GAN的算法。 如果您需要图像的身份标签和属性标签,请向发送请求。 交互式人脸图像处理演示 样本图片 CelebAMask-HQ的人脸操纵模型 CelebAMask-HQ可用于多个研究领域,包括:面部图像处理,面部分析,面部识别和面部幻觉。 下面展示了一个关于交互式面部图像处理的应用程
1
matlab的egde源代码 LBP-DBN-face-recognition 使用LBP特征提取算法提取人脸特征,DBN网络来实现人脸识别,测试数据库-ORL数据库,识别率可达90%以上 ###工程使用方法: clone下工程,要根据实际情况修改test_example_DBN.m中的文件路径 我们在该文件中,a=imread(strcat('E:\My RBM-DBN matlab\ORL\ORL\s',num2str(i),'_',num2str(j),'.bmp')); ###工程说明: ####英文简称注释: DBN-深度信念网络、RBM-受限的玻尔兹曼机 、LBP-局部二值模式 ####几点说明: 0-这个程序的功能,使用DBN算法来实现人脸识别,数据库使用ORL数据库,在迭代次数达到3000时,识别准确率98%左右 2-此程序还附带了画学习曲线的功能,画正则参数,隐层结点数,训练样本数的学习曲线 3-DBN是有几层RBM构成,我这个程序实现的是4层网络,输入层-隐层1-隐层2-输出层 4-DBN的训练基本上分为两步,先用RBM的训练方法训练网络得到初始值,来初始化整个网络
2021-10-19 17:52:06 3.29MB 系统开源
1
中值过滤代码matlab 简单手形(掌)识别 在简单环境中识别手形。 此代码基于Matlab。 它被认为可以识别七个手形(类)。 预处理图像步骤 下图显示了所提出的算法,该算法包括三个步骤 为了检测皮肤,我假设使用大小为5的中值滤波器将图像中的噪声降低5。为了提取皮肤区域,使用等式(1)和(2)将每个像素的通道映射到新空间。 然后,将等式(3)中所示的阈值用于分离皮肤/手部区域并对图像进行二值化。 如果每个像素的条件不满足方程式(3)中的条件,则将其视为图像中具有黑色的背景像素。 否则,像素为白色的前景/手部区域。 ###边缘检测必须找到手掌上的边缘像素以找到手的形状。 为此,使用属于手部区域的前景像素来计算重心。 然后计算边缘像素之间的欧几里得距离和重心,以找到用于手形识别的指尖。 识别方法 为了在作为边缘检测结果的图像上找到指尖,将重心距离最大的边缘像素视为指尖。 该算法在每个边缘像素上进行这些比较,以找到所有指尖。 除了找到指尖之外,还需要在重心和指尖之间绘制一条线,以便计算线之间的角度以识别手的形状。 例如,拇指和食指之间存在特定角度。 此外,有必要考虑(画出)从图像第一行的最
2021-10-19 17:27:38 4KB 系统开源
1
文字识别工具箱 1.项目介绍 该项目是基于pytorch深度学习框架,以统一的改写方式实现了以下6篇经典的文字识别论文,论文的清单如下。该项目会持续进行更新,欢迎大家提出问题以及对代码进行贡献。 模型 文章标题 发表年份 模型方法划分 神经网络 《基于端到端的可训练神经网络基于图像的序列识别及其在场景文本识别中的应用》 2017年 CNN + BiLSTM + CTC 神经网络 《 OCR门控递归卷积神经网络》 2017年 门控循环抽提层+ BiSTM + CTC 扇子 《关注:在自然图像中实现准确的文本识别》 2017年 聚焦网络+ 1D关注 SAR 《显示,参加和阅读:用于不规则文本识别的简单而强大的基准》 2019年 ResNet + 2D注意 担 《文本识别的去耦注意力网络》 2020年 FCN +卷积对齐模块 卫星 《论具有二维自我注意的任意形状的文本的识别》 2
1
Maix-SpeechRecognizer:使用Maixduino框架和PlatfomIO开发的语音识别或唤醒单词检测演示,可在Sipeed的Maix开发板上的K210 MCU上运行
2021-10-17 22:46:20 17KB arduino ai speech-recognition wakeword
1