Deep Residual Learning for Image Recognition(七月在线DL翻译组2017.4)
2022-01-07 10:44:47 1.08MB 七月在线 dl
1
Kaggle语音识别 这是针对的Kaggle竞赛的项目,目的是为简单的语音命令构建语音检测器。 该模型是使用连接器时间分类(CTC)成本的卷积残差,向后LSTM网络,由TensorFlow编写。 首先将音频波文件转换为滤波器组频谱图。 CNN层从频谱图输入中提取分层特征,而LSTM层的作用类似于编码器/解码器,对CNN特征的序列进行编码,并输出字符作为输出。 LSTM编码器/解码器非常动态。 取决于训练词汇,可以用整个单词,音节或仅音素的信息对发出的字符进行编码。 完全连接的层会压缩表示形式,并进一步将字符与单词解耦。 该项目旨在调试和可视化友好。 提供这些界面以权重和激活,登录TensorBoard并记录示例单词的学习,这些示例单词显示了如何在训练中学习角色和决策边界。 安装和使用: 先决条件:Python 3.5,TensorFlow 1.4; 或Python 3.6,Tens
2022-01-06 13:45:16 1.93MB tensorflow kaggle lstm speech-recognition
1
神经网络与模式识别方面的经典书籍,没下过的来下
2022-01-06 11:35:51 22.44MB Neural Networks Pattern Recognition
1
深度较之宽度对神经网络具有更重要的意义,能一定程度模拟人脑,但是随着深度的加深,会出现梯度消失问题,阻碍了模型的收敛。Deep Residual Learning for Image Recognition一文给出了一种避免梯度消失的网络模型-深度残差网络,对深度学习的发展至关重要。
2022-01-04 19:05:39 282KB AI
1
Facial Action Recognition for Facial Expression.....
2022-01-03 16:15:26 810KB 表情识别
1
性别识别 通过CNN神经网络,把输入的人脸图片分辨为男性或女性 数据集要求: 下载后将Caucasian数据文件放入项目目录下 运行prepear_data.py把数据分割,自动生成data目录存放分割后的数据 运行train.py训练,eval.py测试。
2022-01-03 14:14:20 11KB Python
1
基于变压器的场景文本识别(Transformer-STR) 我的基于场景文本识别(STR)新方法的PyTorch实现。 我改编了由设计的四阶段STR框架,并替换了Pred. 变压器的舞台。 配备了Transformer,此方法在CUTE80上优于上述深层文本识别基准的最佳模型7.6% 。 从下载预训练的砝码 该预训练权重在Synthetic数据集上进行了约700K次迭代训练。 Git克隆此仓库并下载权重文件,将其移至checkpoints目录。 从 下载lmdb数据集以进行训练和评估(由) data_lmdb_release.zip包含以下内容。 训练数据集: [1]和 [2] 验证数据集:训练集 [3], [4], [5]和 [6]的并集。 评估数据集:基准评估数据集,由 [5], [6], IC03 [7], IC13 [3], IC15 [4], SVTP [8]和
2022-01-02 13:59:23 154KB ocr text-recognition transformer-str Python
1
A_survey_of_named_entity_recognition_and_classification
2021-12-31 16:15:52 131KB named entity recognition classified
1
人脸识别硬件 在FPGA上实现基于人工神经网络的人脸识别
2021-12-31 15:59:34 30.41MB C
1
lda分类代码matlab 面部识别 在MATLAB中实现基本分类器(Bayes'、K-Nearest Neighbors、PCA、LDA),实现人脸识别。 介绍 有关作业的正式定义,请参阅项目。 有关结果的摘要,请参阅我的 . 如何运行代码 为了保持代码的可读性和模块化,每个分类器和降维技术都在位于目录中的单独 MATLAB 函数中实现。 帮助函数方便地位于目录中。 该脚本位于代码目录的顶层。 我将脚本分为以下几个部分: 预处理数据 负载变量 划分数据(训练和测试) 贝叶斯分类 K-最近邻分类 主成分分析 (PCA) PCA后的贝叶斯分类 PCA 后的 K 最近邻分类 Fisher 线性判别分析 (LDA) LDA后的贝叶斯分类 LDA后的K-最近邻分类 主文件包含不同情况的初始条件和参数。 要测试不同的功能,只需修改这些状态​​条件变量。 该脚本可以完整运行,也可以一次运行一个部分,以观察和分析给定部分的结果。 在脚本的末尾,每种分类技术的结果都显示在一个表格中。 下面是在人脸数据集上运行整个脚本时的示例表。 所有输入数据都可以在.mat文件形式的目录中找到。 如需任何帮助或说明,
2021-12-30 16:33:29 9.51MB 系统开源
1